공공부문 초거대 AI 도입‧활용 가이드라인

The document is primarily framed around enabling public sector adoption of hyperscale AI to improve government service quality, administrative efficiency, and digital platform government goals. The stated purpose is to guide public agencies in introducing AI to streamline work, enhance citizen services, and foster AI innovation ecosystems. Safety and security considerations (data security grades, cloud security certification) appear as prerequisites for adoption rather than the primary justification. Economic competitiveness is secondary, evidenced by references to strengthening Korea's hyperscale AI competitiveness. Consumer/public safety appears as a guardrail concern.

normalized text

1 section

01
Full text
목 차 1. 개요 1 1.1. 초거대 AI 시대 도래 ······················································· 2 1.2. 디지털플랫폼정부 초거대 AI 추진 방향 ······················ 5 1.3. 가이드라인 목적 및 구성 ··············································· 6 2. 초거대 AI 기술 및 사례 9 2.1. 초거대 AI와 초거대 언어 모델(LLM) ························ 10 2.2. 클라우드컴퓨팅서비스 ·················································· 12 2.3. 국내 기업의 초거대 AI 시장 현황 ····························· 13 2.4. 초거대 AI 적용 서비스 분류 및 활용 사례 ············· 14 ※ 지자체 주요 부서별 활용 예시 ····································· 22 공공부문 초거대 AI 도입･활용 가이드라인 3. 초거대 AI 도입 절차 25 3.1. 도입 원칙 및 고려사항 ················································ 26 3.2. 도입 절차 ······································································· 28 3.2.1. 데이터 보안 등급 ······················································ 29 3.2.2. 클라우드 서비스 구성 방안 ···································· 30 3.2.3. 데이터 학습 방식 ······················································ 33 3.2.4. 서비스 도입 방식 ······················································ 37 3.2.5. 서비스 레벨 목표(SLO) ·········································· 40 3.2.6. 유지보수 및 운영(Operations) ··························· 42 3.3. 초거대 AI 도입 체크리스트 ······································· 43 4. 부록 47 ● ’23년 초거대 AI 활용 지원 사업 주요 현황 ············· 48 PART1 개요 • 공공부문 초거대 AI 도입·활용 가이드라인 • 공공부문 초거대 AI 도입･활용 가이드라인 2 1 개요 1.1 초거대 AI 시대 도래 ● 생성형 인공지능(AI) ‘ChatGPT’ 등장 - ChatGPT가 2022년 11월 출시된 이래로 Alibaba, Google, Meta, Microsoft 등 해외 빅테크 기업을 선두로 보다 많은 매개변수, 보다 빠르고 정확한 성능 등을 내세우며 수많은 생성형 인공지능(Generative AI)과 초거대 언어 모델(Large Language Model, 이하 LLM)을 출시하고 있음 - ChatGPT를 선보인 OpenAI는 이후에도 기술 정보를 공개하지 않는 폐쇄형 LLM으로 GPT-4를 출시(’23.11월)하였고, 구글도 폐쇄형 LLM으로 LaMDA 기반 Bard를 출시 (’23.3월)함 - 반면 오픈소스 진영은 Meta가 선도적으로 LLaMA를 연구 목적에 한해 소스 코드를 무료로 개방하고 있음 - 국내에서도 생성형 AI를 기반으로 하는 많은 서비스가 출시되었으며, 현재도 하루가 다르게 발전해 가고 있음 표 1 국내 초거대 AI 서비스 현황(’24.3월) 개발기업 모델명 주요 내용 KAKAO 프로젝트 KoGPT - ’21.11월 GPT-3 기반으로 한국어 특화 AI로 발전시킨 언어모델 - 한국어 및 한국문화지식 관련 높은 성능을 보이는 언어모델 고도화 - 범용화를 위한 초거대 언어모델, 프러덕트 최적화 언어모델 보유 프로젝트 Karlo - ’22.12월 칼로1.0 깃허브 공개, 텍스트 기반으로 고품질 이미지 생성 - ’23.7월 칼로2.0 카카오 디벨로퍼스 API 형태 공개 - ’23.11월 칼로 AI 프로필 서비스 톡채널 개설 KT 믿:음 - ’22년 믿:음 LLM 확보, ’23년 믿:음 Studio 공개 - AI Full Stack 전략 기반으로 맞춤형, 신뢰성, 편의성, 효율성 특화 - AICC, 지니TV에 적용되어 상담사 및 마케터 업무 효율화 및 일상 속의 초거대AI 확산을 위해 B2B, B2G 사업 중 Part 1. 개요 3 개발기업 모델명 주요 내용 LG 엑사원 (EXAONE) - ’23.7월 초거대 멀티모달 AI ‘엑사원(EXAONE) 2.0’ 공개 - 고품질 학습 데이터, 비용 효율성, 맞춤형 모델 설계 등의 경쟁력 보유 - ‘전문가 AI’ 서비스 개발의 기반인 엑사원 3대 플랫폼 유니버스, 디스커버리, 아틀리에 공개 NAVER Hyper ClovaX - 자사 서비스에서 축적된 다양한 한국어 데이터를 학습한 언어 모델로 ChatGPT보다 한국어 이해 능력이 뛰어난 언어 모델 - 이용자와 자연스러운 한국어 소통이 가능하고, 법과 제도, 문화적 맥락 등 한국 사회를 전반적으로 이해하는 AI - 기업용 하이퍼클로바X B2B 사업을 추진하고 있으며, 초대규모 AI 프로덕트 구축 가능 SKT 에이닷(A.) - ’23.9월 한국어 LLM 서비스 에이닷 정식 출시 - 기업 및 공공기관 등의 요구에 맞춰 대화 및 고객센터 등 통신사 기반 서비스를 중심으로 자체 개발한 모델 - 통화 요약, 실시간 통역 등을 제공하는 AI 전화 서비스와 생활 전반 일상에 AI를 결합한 AI 수면 관리, AI 뮤직 서비스 제공 ※ 개발기업의 영문명 순으로 기술 - 대규모 학습데이터와 파라미터를 기반으로 하여, 혁신적인 AI 서비스를 제공하는 초거대 언어 모델(LLM)은 국내에서 ‘초거대 AI’와 ‘생성형 AI’로 혼용하여 사용되고 있음 - 또한, 제시된 초거대 AI 서비스 외에도 상대적으로 낮은 컴퓨팅 자원, 파라미터 수 등을 사용하여 학습 시간이나 비용을 절감할 수 있는 sLLM(Small Large Language Model)의 형태로도 확산되고 있으며, 이러한 sLLM의 경우 금융, 법률, 조세 등 특화된 도메인 영역에서 많이 활용되고 있음 공공부문 초거대 AI 도입･활용 가이드라인 4 그림 1 인공지능 종류와 초거대 AI 관계 ● 초거대 AI가 가져올 변화 - 기존의 언어모델이 주로 챗봇이나 분류기능 형태로 구현되어 질문을 분류하고 해당 질문에 맞게 사전 정의된 답변을 내놓는 것이었다면, 초거대 AI는 대화의 맥락을 이해하고 답변을 스스로 만들어 낼 수 있는 능력에서 차별점을 가짐 - 예를 들어 노래, 시, 소스코드 등을 만들어 주기도 하고, 이전에 나눴던 대화를 기억하고 답변의 실수를 인정하기도 함. 이러한 과정속에서 답변의 품질이 높아지게 되는데 마치 사람 간의 대화를 통해 의미를 찾아가는 과정과 매우 유사하다고 볼 수 있음 - 이러한 혁신성을 바탕으로 초거대 AI는 의료, 금융, 교육, 문화예술, IT 등 다양한 분야에서 업무를 자동화하여 생산성 제고, 만족도 향상, 비즈니스 창출 등의 효과를 낼 것으로 기대함 Part 1. 개요 5 1.2 디지털플랫폼정부 초거대 AI 추진 방향 ● 디지털플랫폼정부 - 디지털플랫폼정부(Digital Platform Government)는 인공지능, 데이터 중심의 디지털 심화 시대 도래에 따라 디지털 기술과 민간의 혁신 역량을 최대한 수용하여 국민의 불편을 없애고, 국민 중심으로 정부가 한 팀으로 뛰는 정부혁신, 기업에게 성장의 기회를 제공하는 것 등을 목표로 하고 있음 ● 초거대 AI 관련 추진 방향 - 디지털플랫폼정부위원회는 공개된 정부 문서를 AI가 읽을 수 있는 형태로 데이터화하고 학습함으로써 국민이 공공서비스를 쉽게 이용할 수 있도록 서비스 품질을 제고하고자 함 - 또한 내부적으로는 보안이 보장된 영역에서 ‘클라우드 네이티브’를 적극 활용하여 초거대 AI 서비스를 제공할 수 있도록 준비하고 있음 - ‘디지털플랫폼정부 실현계획’(’23.4월)에 따르면 인공지능･데이터･서비스가 융합된 플랫폼을 마련하기 위해 ’DPG 허브‘ 등 혁신인프라를 구성하여 민간의 초거대 AI를 적극 활용할 수 있는 기반을 조성하고 있음 - 이러한 초거대 AI의 혁신 기술을 활용하여 복지, 재난, 청년 등 사회현안의 해결에 기여 하고, 공공의 본질적 업무나 반드시 사람의 참여･검토 등을 필요로 하는 창의적 업무에 보다 많은 시간을 할애할 수 있도록 함 ● 공공부문 초거대 AI 관련 정책 동향 - (과기정통부) 초거대 AI의 가능성에 대비하고 디지털 모범국가로서의 기틀을 마련하기 위하여 ‘초거대 AI 경쟁력 강화 방안’(’23.4월)을 통해 다음과 같은 추진전략을 수립함 ① 초거대 AI 기술･산업 핵심 인프라 확충을 위한 데이터, R&D, 알고리즘, 컴퓨팅인프라의 지원 ② 초거대 AI 혁신 생태계 조성을 위한 초거대 AI 플래그십 프로젝트 추진 및 SaaS 활성화 ③ 범국가 AI 혁신 제도･문화 정착을 위해 분야･이슈별 대응 방안 모색 - (행안부) 초거대 AI를 행정업무에 올바르게 활용할 수 있도록 ‘챗GPT 활용방법 및 주의사항 안내서’를 배포(’23.5월)하였으며, 정부 전용의 초거대 AI 구현 방안 마련을 위한 정보화전략 계획(ISP)을 수립(’24.4~10월)하고 있음 - (국정원) 각 기관이 AI 기술을 안전하게 활용할 수 있도록 ‘챗GPT 등 생성형 AI 활용 보안 가이드라인’(’23.6월)을 발간하여 정보화사업 구축 방안 및 보안 대책 등을 마련함 공공부문 초거대 AI 도입･활용 가이드라인 6 1.3 가이드라인 목적 및 구성 ● 목적 - 본 가이드라인은 중앙부처･지자체･공공기관･국회･법원 등 전 공공부문에서 디지털플랫폼 정부의 철학과 원칙에 따라 초거대 AI를 도입·활용하는데 필요한 관련 기준과 절차, 고려 사항을 안내하는 것을 목적으로 함 - 또한 공공부문의 정보시스템 담당자에게는 초거대 AI 도입과 활용에 필요한 실무적 지침을 제공하고자 함 ● 구성 - 본 가이드라인은 개요, 초거대 AI 기술 및 사례, 초거대 AI 도입 절차 등 3개의 장과 부록 으로 구성함 표 2 초거대 AI 도입·활용 가이드라인 구성 1. 개요 2. 초거대 AI 기술 및 사례 3. 초거대 AI 도입 절차 1.1 초거대 AI 시대 도래 2.1 초거대 AI와 초거대 언어 모델(LLM) 3.1 도입 원칙 및 고려사항 1.2 디지털플랫폼정부 초거대 AI 추진 방향 2.2 클라우드컴퓨팅서비스 3.2 도입 절차 1.3 가이드라인 목적 및 구성 2.3 국내 기업의 초거대 AI 시장 현황 3.2.1 데이터 보안 등급 2.4 초거대 AI 공공서비스 분류 및 활용 사례 3.2.2 클라우드 서비스 구성 방안 3.2.3 데이터 학습 방식 3.2.4 서비스 도입 방식 3.2.5 서비스 레벨 목표 3.2.6 유지보수 및 운영 3.3 초거대 AI 도입 체크리스트 Part 1. 개요 7 - 1장 ‘개요’에서는 초거대 AI 기술의 확산에 따른 국내 현황 및 가이드라인의 필요성에 대하여 안내함 - 2장 ‘초거대 AI 기술 및 사례’에서는 초거대 AI 활용을 위한 주요 기술현황과 공공분야에서 도입 가능한 서비스 활용 사례를 제시함 - 3장 ‘초거대 AI 도입 절차’에서는 공공부문에서 실제 도입시 준수해야 할 원칙과 관련 기술 적용에 필요한 검토사항 등을 절차별로 안내함 관련 용어 용 어 정 의 초거대 AI 대규모 데이터셋을 기반으로 훈련된 딥러닝 모델을 사용하여 문서를 요약, 대조하거나 새로운 콘텐츠를 생성하는 등의 인공지능 초거대 언어 모델 (LLM, Large Language Model) 초거대 규모로 자연어를 학습시킨 인공지능 언어 모델 파운데이션 모델 (Foundation Model) 초거대 AI의 서비스를 제공하기 위해 기초가 되는 모델 파인튜닝 (Fine-tuning) 파운데이션 모델을 특정 작업이나 도메인에 최적화하기 위해 특화된 데이터로 모델의 가중치를 미세하게 조정하여 추가로 학습시키는 방법 사후학습 (Post-training) 파운데이션 모델에 데이터의 최신성과 전문성을 위해 자체 보유데이터로 추가학습하여, 파운데이션 모델 자체를 고도화하는 방법 검색 증강 생성(RAG, Retrieval-Augmented Generation) 답변 생성에 있어 외부 리소스를 추가하는 방식의 기술 소규모 초거대 언어 모델 (sLLM, Small Large Language Model) 초거대 언어 모델에 비해 상대적으로 적은 파라미터를 사용하여 학습 시간이나 비용을 절감한 모델 공공부문 초거대 AI 도입･활용 가이드라인 8 관련 용어 용 어 정 의 클라우드컴퓨팅서비스 클라우드컴퓨팅을 활용하여 상용(商用)으로 타인에게 정보통신자원을 제공하는 서비스 클라우드컴퓨팅서비스 보안인증 (CSAP, Cloud Security Assurance Program) 「클라우드컴퓨팅 발전 및 이용자 보호에 관한 법률」 제23조의2에 따라 한국인터넷 진흥원의 장이 클라우드컴퓨팅서비스의 보안성에 대하여 실시하는 인증 민간 클라우드 「클라우드컴퓨팅법」제2조제3호에 따른 “클라우드컴퓨팅서비스”로 민간 기업 또는 단체가 제공하는 클라우드컴퓨팅서비스 멀티 클라우드 두 개 이상의 독립적인 클라우드 서비스 제공자가 제공하는 복수의 클라우드컴퓨팅 서비스를 연계하여 사용하는 클라우드 배포 모델 디지털서비스 이용지원시스템 「클라우드컴퓨팅법 시행령」 제15조의2제3항에 따라 디지털서비스를 등록 및 관리하는 시스템 Part 2. 초거대 AI 기술 및 사례 9 PART 2 초거대 AI 기술 및 사례 • 공공부문 초거대 AI 도입·활용 가이드라인 • 공공부문 초거대 AI 도입･활용 가이드라인 10 2 초거대 AI 기술 및 사례 2.1 초거대 AI와 초거대 언어 모델(LLM) ● 초거대 AI - 대규모 데이터 세트를 기반으로 훈련된 딥러닝 모델을 사용하여 문서를 요약, 대조하거나 새로운 콘텐츠를 생성하는 등의 인공지능 기술을 의미함 - 초거대 AI도 머신러닝, 딥러닝, 언어모델 등의 기술을 기반으로 동작하지만, 모델의 크기나 학습에 사용되는 데이터의 양과 질에 따라 성능의 차이가 발생할 수 있음 - 아울러, 데이터에 내재된 편향이 학습에 반영될 수 있으므로 이를 완화하기 위한 노력도 필요함 ● 초거대 언어 모델(LLM, Large Language Model) - 초거대 규모로 자연어를 학습시킨 인공지능 언어모델로, 학습에 필요한 매개변수(파라미터)의 규모가 수~수천 B(1Billion, 10억개) 정도가 됨 - 대규모 텍스트 데이터로 사전 훈련되지만, 실제 작업에 특화되지 않아서 특정 도메인의 언어 이해가 부족하거나 새로운 데이터에 대해서 잘못된 정보를 제공하는 등 일반화 성능이 낮고, 편향적 결과를 생성하는 문제가 발생할 수 있음 ● 소규모 초거대 언어 모델(sLLM, Small Large Language Model) - 초거대 언어 모델에 비해 상대적으로 적은 파라미터를 사용하여 학습 시간이나 비용을 절감한 모델로, 일반적으로 파인튜닝 등의 기술과 함께 사용하여 부족한 성능을 보완함 - 초거대 언어 모델을 사용할 것인지, 비교적 작은 모델에 추가적인 기술을 더할 것인지는 사용되는 언어 모델의 크기나 컴퓨팅 자원, 수행하는 업무 등을 종합적으로 고려하여 최적의 모델을 찾는 것이 중요함 ● 주요 구성요소 - 초거대 언어 모델을 기반으로 하는 인공지능을 구현하기 위해서는 알고리즘, 하드웨어, 데이터 등 구성요소에 대한 핵심기술의 보유와 발전이 필수적임 Part 2. 초거대 AI 기술 및 사례 11 표 3 초거대 언어 모델의 주요 구성요소 구 분 주 요 내 용 알고리즘 문제해결을 위한 추론과 학습 능력 컴퓨팅 파워 막대한 양의 데이터 연산에 필요한 하드웨어 데이터 성능 향상을 위한 다양한 형태의 대규모 학습 자원 보편적 지능 인간 수준의 인지능력과 사고능력을 학습･평가 AI 안정성 사람이 제어할 수 있는 환경에서 믿을만한 답을 도출 AI 윤리 기준 초거대 AI의 인간 사회 가치, 윤리와의 부합성 등 ● 초거대 언어 모델(LLM)의 학습 및 활용 방안 1) 파운데이션 모델(Foundation Model) - 광범위한 비라벨링 데이터 집합으로 학습한 AI 모델로써 자연어 처리, 컴퓨터 비전, 기계 번역 등 다양한 작업에 적용할 수 있는 모델 유형 - 초거대 AI 서비스를 제공하기 위한 기초가 되며, LLM을 포괄하는 개념으로 파인튜닝과 같은 추가학습을 통해 특화된 모델로 가공할 수 있음 2) 파인튜닝(Fine-tuning) - 사전 훈련된(Pre-trained) LLM을 특정 작업이나 도메인에 최적화하기 위해 특화된 데이터로 모델의 가중치를 미세하게 조정하여 추가로 학습시키는 방법 3) 사후학습(Post-training) - 사전 훈련된(Pre-trained) LLM에 데이터의 최신성과 전문성을 위해 자체 보유데이터로 추가학습하여, 파운데이션 모델 자체를 고도화하는 방법 4) 검색 증강 생성(RAG, Retrieval-Augmented Generation) - 답변 생성에 있어 외부 리소스를 추가하는 방식의 기술로써 보다 정확한 답변 제공이 가능하며 할루시네이션(환각)을 감소시키는 효과를 가짐. 최신 기술 정보를 담은 외부 리소스로부터 데이터를 얻기 위해 LLM과의 양방향 소통이 필요함 공공부문 초거대 AI 도입･활용 가이드라인 12 2.2 클라우드컴퓨팅서비스 ● 초거대 규모의 데이터 학습과 처리를 위해서는 고성능의 연산 자원이 필요한데, 클라우드 컴퓨팅은 이러한 대규모 데이터 처리를 위한 인프라와 응용서비스 개발에 필요한 다양한 도구를 제공함 ● 클라우드컴퓨팅서비스를 이용하기 위해서는 ‘클라우드컴퓨팅서비스 보안인증제도’의 기준에 부합하는 민간 클라우드 서비스나 국가정보자원관리원의 G-클라우드 등을 이용할 수 있음 ● 클라우드컴퓨팅서비스 보안인증제도(CSAP, Cloud Security Assurance Program) - 중앙부처･지자체･공공기관에게 안전성 및 신뢰성이 검증된 민간 클라우드 서비스를 공급 하고 이용자에게 안전한 클라우드 서비스를 제공하기 위한 제도임 - 데이터의 중요성과 민감도에 따라 적합한 보안 기술을 적용하여야 하며, 데이터의 유출 및 악용을 예방하여야 함 ● 클라우드컴퓨팅서비스는 서비스 제공 범위에 따라 ‘IaaS’, ‘PaaS’, ‘SaaS’ 등이 있음 표 4 서비스 유형 구 분 주 요 내 용 ① IaaS - 인프라 제공 서비스(Infrastructure-as-a-Service) - 서버, 저장장치, 네트워크 등 IT 인프라를 서비스로 제공 ② PaaS - 플랫폼 제공 서비스(Platform-as-a-Service) - 응용프로그램 등 소프트웨어의 개발ㆍ배포ㆍ운영ㆍ관리 등을 위한 환경을 제공하는 서비스 ③ SaaS - 소프트웨어 제공 서비스(Software-as-a-Service) - 응용프로그램 등 소프트웨어를 서비스로 제공 복합서비스 - ①부터 ③까지 둘 이상의 서비스를 복합적으로 제공 ※ ‘행정ㆍ공공기관 클라우드컴퓨팅서비스 이용안내서’(행안부ㆍNIA, ‘22.6월) 참고 Part 2. 초거대 AI 기술 및 사례 13 2.3 국내 기업의 초거대 AI 시장 현황 ● 국내의 초거대 언어 모델(LLM) 시장은 인프라를 담당하는 ‘플랫폼 인프라 영역’과 LLM을 제공하는 ‘AI 모델 영역’, 사용자에게 실질적인 서비스를 제공하는 ‘애플리케이션 영역’으로 분류할 수 있음 ● 또한 ‘플랫폼 인프라 영역’에서부터 ‘애플리케이션 영역’까지 전 범위를 서비스하는 ‘풀스택 (토탈서비스) 영역’과 기술 도입을 위한 ‘컨설팅 영역’의 시장도 있음 ● 국내 플랫폼 기업은 광범위한 데이터 인프라를 바탕으로 자체 LLM을 선보이며 공급기업 으로 자리매김하고 있고, 중소 스타트업은 애플리케이션 영역에서 LLM을 이용한 서비스를 제공하거나 AI 모델 영역의 sLLM 형태로 추진하고 있음 표 5 국내 LLM 시장 현황 구 분 주 요 내 용 애플리케이션 영역 - 업계의 요구사항에 맞춰 전문적으로 고객 맞춤 서비스 제공 - 대부분 SI기업이나 스타트업으로 구성 AI 모델 영역 - ‘애플리케이션 영역’을 지원하는 영역으로 LLM 및 LLM API 서비스 등을 제공하여 엔터프라이즈 및 산업별 솔루션을 제공 - ‘애플리케이션 영역’에서 필요로 하는 다양한 요구에 맞게 AI 모델 및 알고리즘 개발하거나 sLLM을 제공하는 기업이 주를 이룸 플랫폼 인프라 영역 - 대부분 클라우드 인프라를 갖춘 플랫폼 형태의 기업으로 ‘AI 모델 영역’과 ‘애플리케이션 영역’을 지원하는 역할을 함 - 자본과 기술이 집약된 빅테크 기업의 영향력이 큼 풀스택(토탈서비스) 영역 - 빅테크 기업이 가진 풍부한 자원을 바탕으로 LLM을 구성하거나 개인 맞춤화된 서비스로 제공하는 전 영역을 서비스 컨설팅 영역 - 기업･기관에서 생성형 AI 도입을 위한 전사적 방안을 제시 - 생성형 AI의 효율적인 사용을 위한 컨설팅 서비스 등 공공부문 초거대 AI 도입･활용 가이드라인 14 2.4 초거대 AI 적용 서비스 분류 및 활용 사례 ● 초거대 AI를 적용하여 서비스를 구현하는 방식은 추가학습 방식과 외부 서비스의 연계성 등을 고려하여 3가지로 분류할 수 있고, 서비스 유형은 6가지로 분류할 수 있음 ● 서비스 구현 방식 1) 추가학습 없이 파운데이션 모델을 그대로 이용하여 구현 2) 파운데이션 모델에서 각 기관이 가진 데이터를 추가로 학습하여 서비스를 구현 그림 2 추가학습(예시) ※ 사용자 ⟷ AI 서비스(LLM UI) 3) 독립된 서비스에서만 동작하는 방식이 아닌 민간 App이나 다른 서비스로 연계하여 구현 - 외부 연계 방식은 외부 서비스와의 상호 작용을 통해 언어 모델 기능의 한계를 극복하고, 보다 다양하고 완결성 있는 서비스를 제공할 수 있음 그림 3 서비스 Add On(예시) ※ 사용자 ⟷ AI 서비스(LLM UI) ⟷ 외부 서비스 App Part 2. 초거대 AI 기술 및 사례 15 ● 공공업무의 서비스 분류 유형 - 각 서비스의 유형은 독립적, 배타적으로 적용되는 것이 아니라 대상 업무의 특성에 따라 여러 개의 유형이 종합적으로 활용될 수 있음 표 6 공공업무 적용 서비스 유형에 따른 분류 구 분 주 요 내 용 질의 응답 - 작성된 행정문서나 내부 자료에 대해 키워드, 날짜별 등 원하는 자료를 말하듯이 검색하는 유형 분석･활용 - 표, 그래프, 이미지, 수기 작성된 문서 등을 정형데이터로 전환･활용하여 통계, 분석, 시사점 도출 등으로 제공하는 유형 문서 작성 - 정기간행물, 회의자료 요약, 번역, 이메일 작성 등 단순･반복적 보고서의 초안을 자동으로 작성해 주는 유형 기획･창작 - 행사, 프로그램 기획, 카이라이팅 문구 등 기존 유사 자료를 학습해 관련된 이미지나 자료를 창작해 주는 유형 상담 지원 - 고객과의 상담을 위해 유사사례와 과거 이력을 검색하고, 자료를 확인･대조･ 요약하여 맞춤형으로 안내할 수 있도록 지원하는 유형 서비스 처리 - 대화형 질의를 통해 외부서비스의 추가적인 자료나 기능을 연계하여 행정, 민원 업무를 중단없이 완결･처리하는 유형 1) 질의 응답 - 중앙부처･지자체 등에서 운영하는 각 사이트에 검색을 하기 위해 민간 포털을 통해 사이트의 메뉴 위치를 찾는 방법부터 다시 검색하는 등 여러 불편함이 있음 - 자료 검색에 초거대 AI 기술을 활용하면 상세 메뉴를 찾아 들어가지 않아도 찾고자 하는 정보를 질의하여, 사용자의 의도에 맞는 원하는 자료를 찾을 수 있음 - 온나라 행정문서나 각 지자체 등 공무원 내부 업무에서도 자료 검색과 관련된 다양한 분야에서 초거대 AI의 정보 검색 기능을 활용할 수 있음 공공부문 초거대 AI 도입･활용 가이드라인 16 사 례 < 정부･기관 사용자의 업무 활용을 위한 정보 검색 > ● 철도, 원자력 등 위험업무의 안전 작업을 위해 최신 안전 점검 가이드와 관련 법령을 알려주는 안전사고 예방 검색 서비스 ● 사진을 이용해 식자재의 품목, 원산지를 찾아주는 유통 정보 검색 서비스 ● 각종 업무처리 제도･규정･지침, 인계인수 매뉴얼, 보고자료 등을 통합적으로 검색 하는 서비스 < 국민 편의성 제공을 위한 대국민 정보 검색 > ● 민간 포털에 검색하듯 질문하여 주민등록등본, 가족관계증명서 등을 발급받는 서비스 ● 관광지의 시설 정보와 이용 방법, 편의시설, 숙박, 교통정보 등을 검색하는 서비스 ● 국민연금 및 건강보험 납부, 근로자 산재보상 등 본인에게 해당하는 정책지원을 검색 하는 서비스 < 전문 분야 특화 검색 > ● 해외직구에 대한 개인통관고유부호, 통관정보, 예상세액 등을 조회하는 서비스 ● 시기, 모양, 형태, 색상 등으로 문화유산을 검색하는 서비스 ● 법제처, 형사법무정책연구원 등이 보유한 법률 및 판례를 검색하는 서비스 < 철도 업무의 안전 작업을 위한 법령 정보 검색 사례 > Part 2. 초거대 AI 기술 및 사례 17 2) 분석･활용 - 공공에서 보유한 산출물과 데이터는 품질이 우수하지만, 데이터 형식 등 종류가 다양하고 표, 그래프, 이미지 등 비정형 데이터가 주를 이루고 있어 이를 활용하기 위해서는 별도의 데이터 분석 도구와 일정 수준의 분석 기술이 필요함 - 데이터 분석에 초거대 AI를 활용하면 자연어 기반의 질의를 통해 데이터의 구조를 스스로 파악하고 이를 요약, 가공하거나 이종의 데이터를 결합하여 새로운 정보를 생성하는 등의 업무를 수행할 수 있음 - 보도된 기사를 수집･요약하는 동향 파악, 데이터 간의 시계열 미래 예측, 코딩 분석･ 수정 등과 같은 서비스로 활용할 수 있음 사 례 < 정형･비정형 데이터를 변환하여 분석･활용 > ● 보도된 기사를 수집･분석하여 경제･정책･문화 등에 대한 동향 및 추세분석 서비스 ● 교통 신호체계 및 사고 발생 현황을 조합하여 교통 안정성과 이동성을 향상시키는 차세대 지능형 교통 시스템(C-ITS, Cooperative-Intelligent Transport Systems)의 서비스 활용 ● 의료급여 수급자의 연령, 지역, 병명, 직업을 분석하여 복지 사각지대 해소하는 서비스 ● 조달･공모사업의 리스트를 검색･요약하여 중복성을 검토하는 서비스 ● 구인･구직에 대한 정보를 학습하여 국내･외 취업 시장의 현황 및 문제점을 해결하는 서비스 < 뉴스의 이슈키워드 생성 및 데일리 리포트를 제공하는 분석･활용 사례 > 공공부문 초거대 AI 도입･활용 가이드라인 18 3) 문서 작성 - 그간 공공에서는 대규모 정보화 사업을 통해 일정 수준의 디지털 전환에 도달하였으나, 여전히 업무는 단순･반복･기계적 문서 작성 등 아날로그 방식으로 수행하고 있음 - 이로 인해 담당 직원의 업무 피로도는 증가되고, 대민서비스와 같은 핵심적인 업무에 필요한 인력이 적절히 배치되지 못하는 등 비효율적 운영이 발생됨 - 초거대 AI 기술을 활용하여 주기적 작성하는 동일한 형태의 보고서나 계획서의 초안을 자동으로 작성할 수 있어 반복적인 작업을 탈피할 수 있음 - 또한 회의 결과 요약을 위해 녹취록을 듣고 참석자의 발언을 분류 정리하는 등의 단순 업무 처리에 시간을 대폭 줄일 수 있음 사 례 < 단순 반복적 업무의 문서 작성 > ● 공공사업 추진을 위해 비슷한 유형의 제안요청서를 참고하여 초안을 자동으로 작성하는 서비스 ● 보도자료, 월간지 등 정기간행물의 일률적인 템플릿 제작 서비스 ● 성명, 전화번호, 수기 작성된 심의 의견서 등의 문서를 디지털 문서 파일로 변환하는 서비스 ● 회의 녹취록을 위원별 발언으로 정리하여 회의록 작성하는 서비스 ● 설문조사를 위한 문항 생성하고 답변받은 내용을 정리･요약하는 서비스 ● 매월 추진되는 월별 인사위원회의 운영 계획안 작성 서비스 < 제안요청서의 초안을 작성해 주는 문서 작성 사례 > Part 2. 초거대 AI 기술 및 사례 19 4) 기획･창작 - 프로그램을 기획하거나 이미지를 창작하는 업무는 산출물이 나오기 전까지는 기획자의 의도와 품질을 정확히 가늠하기 힘든데, 이러한 특성은 잦은 회의와 수정으로 이어지며 인적･물적 자원의 낭비와 시간 지연 등의 결과를 초래함 - 초거대 AI를 활용하면 기획자의 의도에 맞춰 산출물을 바로 확인하고 즉시 피드백할 수 있어, 다양한 분야에서 기획･창작 업무를 수행할 수 있음 - 이동 장소 간 거리와 방법을 고려하여 행사나 출장의 일정을 자동으로 기획하거나, 저작 도구 없이 스케치만으로 새로운 행사 포스터의 이미지를 창작할 수 있음 사 례 ● 다국어를 기반으로 이력서를 검토하고 첨삭해주는 서비스 ● 지역 특산품, 문화유산, 관광지 등의 홍보를 위해 간단한 스케치와 키워드를 입력하여 저작도구 없이 홍보 포스터, 리플렛, 카피라이팅 등을 창작하는 서비스 ● 정책브리핑, 금리 상승 추이, 주택가격 상승률 등을 종합하여 데이터 기반 시각화 자료를 창작하는 서비스 < 다국어 지원을 통해 이력서를 첨삭해 주는 기획･창작 사례 > 공공부문 초거대 AI 도입･활용 가이드라인 20 5) 상담 지원 - 민원상담 콜센터 근무자는 고객의 요구사항을 파악하여 정확한 정보를 신속히 안내하는 기술적 부분과 민원인을 상대하는 감정 노동 업무를 함께하고 있어 특히 초거대 AI 기술의 활용이 필요한 분야임 - 기존에는 챗봇 형태의 인공지능 기술을 활용하였으나 이는 준비된 질문과 그에 따른 답변을 내놓는 수준이며, 준비되지 않은 질문에는 충분치 못한 답변으로 한계가 있음 - 초거대 AI를 활용한 상담 지원 서비스는 사람과 대화하듯 이전에 나눈 대화를 기억하고 구어체로 질의할 수 있으며 학습한 데이터에 따라 답변할 수 있는 분야가 다양함 - 초거대 AI 챗봇 대화 서비스를 제공하거나 민원인 대상의 상담은 사람이 수행하면서 자료의 검색･대조･요약에만 부분적으로 초거대 AI를 활용하는 형태도 가능함 사 례 < 상담 지원 AI 어시스턴트 > ● 고객의 상담 내용에서 키워드를 추출･검색하여, 관련된 예상 답변을 미리 생성하고 규정 및 법률 등의 출처를 제공하는 민원 처리 서비스 ● 녹취된 상담 내용을 텍스트로 변환하여 분류, 정리, 요약하고 상담 히스토리를 작성하여 개인 맞춤화된 상담을 제공하는 서비스 ● 다문화 가정 및 외국인을 대상으로 한국어↔모국어 번역을 통해 상담해 주는 서비스 < 규정과 법령을 제공하며 민원을 응대하는 상담･안내 사례 > Part 2. 초거대 AI 기술 및 사례 21 6) 서비스 처리 - 공공서비스 처리 시 사용자(국민) 정보와 이전 업무에서의 처리결과를 사용자 동의하에 공유할 수 있음에도, 각각 로그인하여 요구사항을 반복해서 입력하고 처리하는 경우가 발생함 - 초거대 AI를 활용하고 시스템 간 연계가 이루어지면, 사용자는 대화형 질의를 통해 필요한 서비스를 특정하고 LLM 에이전트의 서비스 연계를 통해 중단 없이 서비스를 완결하여 처리할 수 있음 - 이동 장소간 거리와 방법을 고려하여 경로를 선택하면 항공, 기차, 버스 등을 조합하여 가장 합리적인 방법으로 승차권 발급까지 한 번에 처리하는 서비스가 될 것으로 봄 사 례 < 범용적인 서비스로의 연계･확장을 통한 처리 > ● 상담･안내된 내용의 관련 서류를 자동으로 불러오고 바로 작성하여 처리하는 서비스 ● 대화형 질의로 시간과 장소를 특정하여 외부 App 다운로드나 회원가입 없이 KTX 기차표를 예매하는 서비스 ● 현재 위치와 이용 시간을 고려하여 스마트워크, 공공회의실 등을 바로 예약하는 서비스 ● 불법 주정차 단속을 위해 카메라로 인식한 불법 주정차 차량에 대해 시스템에 등록 하고, 고지서를 바로 발급하는 서비스 ● 지방세 신고 납부를 위해 지방세 내역을 홈텍스 세금포인트나 카드포인트로 납부하는 서비스 < 민원인의 질의를 처리 가능한 서비스까지 연계하는 사례 > 공공부문 초거대 AI 도입･활용 가이드라인 22 지자체 주요 부서별 활용 예시 ● 아래는 지자체의 부서별 업무에 따라 도입 가능한 초거대 AI 서비스의 활용 예시임 그림 4 주요 부서별 활용 예시 표 7 주요 부서별 활용 예시 구 분 주 요 내 용 기획조정실 - 행정심판 및 소청심사를 위해 자치법규(조례･규칙)를 조회하고 처리과정과 유사한 판례를 확인할 수 있도록 제공(유형1 질의응답) - 공공토지자원, 국･공유지, 민간점유 유지, 기부채납 시설에 대한 DB 통합 활용으로 공공자산에 대한 효율적 자원 활용(유형2 분석･활용) - 신년 업무보고, 신년사 말씀자료, 예결산 자료 등 유사자료의 템플릿 작성과 국정감사･시정질문 답변서 작성을 위한 음성파일 변환 등에 활용(유형3 문서 작성) 도시교통실 - 도시철도 및 버스 노선관리를 위해 3D FBX, 캐드 DWG 같은 파일을 구조화하여 검색･분석･시각화 자료로 활용(유형2 분석･활용) - 우대용 교통카드 발급을 위해 신청자와 상담하고 작성에 필요한 서류를 안내 (유형5 상담 지원) - 불법 주정차 단속을 위해 카메라로 인식한 불법 주정차 차량에 대해 시스템에 등록하고, 고지서 발급을 바로 시행(유형6 서비스 처리) 디자인정책관 - 야간 경관 모니터링을 위해 현재 신고되어 있는 야간점등 내용 일자별로 검색(유형1 질의 응답) - 수변 공간기획을 위해 이전에 기획된 자료를 바탕으로 신규 기획서 초안을 작성(유형2 분석･활용) - 야간경관 행사를 위해 기 추진 사례와 테마･트렌드에 맞는 키워드를 추가하여 그림 저작도구 없이 이미지 형태로 홍보 포스터, 리플렛을 창작(유형4 기획･창작) Part 2. 초거대 AI 기술 및 사례 23 구 분 주 요 내 용 복지정책실 - 의료급여 수급자 관리를 위해 수급자의 연령, 지역, 병명, 직업 등의 데이터를 분석하여 시사점 도출(유형2 분석･활용) - 호국보훈 행사를 위해 기 추진 사례를 바탕으로 프로그램 세션을 기획･창작 (유형4 기획･창작) - 기초생활보장제도, 복지멤버십 등 급여 민원 관련 상담업무를 연중무휴 안내 (유형5 상담 지원) 소방재난본부 - 화재통계관리 및 증거물, 위험물, 분석장비 등 소방 재원 검색 (유형1 질의 응답) - 시에서 관리하고 있는 소방행정시설 구역과 시설물의 현황, 내용년수, 계절별 집중관리 상태 등 사전 재난 영향성 평가를 토대로 화재 예측･예방 대책 수립(유형2 분석･활용) - 24시간 지연대기 없는 AI 상담사를 통해 사고 및 재난 현장의 위험도를 판단 하고 발신자의 위치, 시간, 상황을 추적하여 긴급출동을 지원(유형6 서비스 처리) 여성가족정책실 - 아동복지 통계관리를 위해 우리 시에 소속된 아동 연령별로 검색(유형1 질의 응답) - 등하굣길 안전 홍보를 위한 홍보 안내문 창작(유형4 기획･창작) - 결식아동의 빠짐없는 급식 지원을 위해 지역 아동센터, 급식카드, 바우처 등 대상자가 주로 사용하는 형태로 지급, 처리가 가능한 서비스 제공(유형6 서비스 처리) 재무국 - 고･소액 체납자에 대한 처리방법 및 관련 법령에 대한 FAQ 검색(유형1 질의 응답) - 조달･물품･용역･인쇄 등 계약 및 납품현황에 대한 세입･세출 현황 자료 작성 (유형3 문서 작성) - 지방세 신고 납부를 위해 조회한 지방세 내역을 홈텍스 세금포인트나 카드포 인트로 바로 납부 처리(유형6 서비스 처리) 행정국 - 공무직･공공안전 관련 업무지침, 노동법, 근로기준법, 취업규칙 등 인사행정 사항 검색(유형1 질의 응답) - 월별 인사위원회 운영 계획안 작성을 위해 이전 운영 계획안을 바탕으로 당월 계획서 초안을 작성(유형3 문서 작성) - 지역 상생을 위한 농･특산물 판매촉진 홍보 및 워케이션 프로그램, 가족친화 프로그램, 동행 프로그램 등 신규 기획안 작성(유형4 기획･창작) Part 3. 초거대 AI 도입 절차 25 PART 3 초거대 AI 도입 절차 • 공공부문 초거대 AI 도입·활용 가이드라인 • 공공부문 초거대 AI 도입･활용 가이드라인 26 3 초거대 AI 도입 절차 3.1 도입 원칙 및 고려사항 ● 공공부문에서 초거대 AI를 도입할 때는 디지털플랫폼정부 실현계획(‘23.4월)에 따라 디지털플랫폼정부 정책방향과 연계하여 추진해야 함 - 이에 초거대 AI를 도입, 활용할 때 준수해야 할 원칙을 아래와 같이 제시함 디지털플랫폼정부 초거대 AI 도입 원칙 원칙 1 민간의 최신 기술을 적기에 도입하고 활용 - 민간의 우수한 클라우드 방식 도입을 우선 검토 - 민관 협력으로 인공지능 산업 생태계를 조성 원칙 2 행정 프로세스와 조직문화 혁신을 함께 수행 - 단순한 신기술 도입에 그치지 않고 업무재설계를 병행 - ‘폭포수(Water-fall) 방식’이 아닌 유연한 ‘애자일(Agile) 방식’을 통한 지속적 성능 개선 원칙 3 부처 간 칸막이를 없애고 하나의 정부를 구현 - 개별 구축은 지양하고 부처 간 데이터와 자원을 공유･결합 - 대국민 서비스는 부처가 한 팀이 되도록 상호 연계･협업 원칙 4 국가 안보와 국민 권리 보호를 보장 - 민감, 기밀 데이터의 외부 유출 방지 - 학습데이터 내 개인정보와 저작권 보호 원칙 5 ‘인공지능 윤리기준(과기정통부, ‘20.12월)’을 준수 - ① 인권 보장, ② 프라이버시 보호, ③ 다양성 존중, ④ 침해 금지, ⑤ 공공성, ⑥ 연대성, ⑦ 데이터 관리, ⑧ 책임성, ⑨ 안전성, ⑩ 투명성 Part 3. 초거대 AI 도입 절차 27 ● 초거대 AI 기술은 현재에도 새로운 기술이 계속 등장하고 있으며 완성된 기술이 아니기 때문에 무분별한 도입에 주의해야 함 - 아래와 같이 기술의 한계와 위험성 등을 고려하고, 사전에 충분한 계획과 준비를 통해 성과를 창출할 수 있도록 추진해야 함 초거대 AI 도입시 사전 고려사항 ◈ 적용 대상 업무와 성과 목표를 명확히 정의 ● 활용 효과가 큰 영역(업무)을 식별하고, 사용자 요구사항을 바탕으로 적합한 생성형 인공지능 기술(제품)의 종류와 특성을 파악 ● 기대하는 결과물의 성능 수준에 따라 학습데이터의 규모와 학습(업데이트) 절차, 클라우드 인프라의 수준을 결정 ◈ 생성형 인공지능의 기술적 한계에 대한 인지 ● 학습데이터의 품질에 따라 편견, 오류의 발생 가능성을 확인하고 이를 보완할 수 있는 기술적, 관리적 조치 마련 ● 자동화 대상과 인간 의사결정 대상을 명확히 구분하고 이에 따른 업무 프로세스를 재정의 ◈ 생성형 인공지능이 가져올 위험을 이해하고 방지 ● 조직 내외의 민감정보, 개인정보 보호 대책 강구 ● 인공지능의 윤리성 확보를 위한 기술적, 제도적 조치 강구 ◈ 전사적 인공지능 거버넌스 정립 ● 명확한 역할과 책임을 부여한 의사결정 체계 확립 (데이터 관리, 보안 관리, 유지운영 관리, 교육 등) ● 조직 내 인공지능 역량 강화 방안 및 업무 혁신 문화 조성 ◈ 인공지능 기반 조직 혁신 전략과 단계적 로드맵 수립 ● 단기에 성과를 도출할 수 있는 업무를 대상으로 시범 적용 및 검증･보완하고, 혁신적 가치가 높은 분야로 단계적 확산 공공부문 초거대 AI 도입･활용 가이드라인 28 3.2 도입 절차 ● 먼저 대상 업무에 대한 목표와 문제점을 분석하고 정부의 정책 방향 및 신기술 적용에 따른 적합성, 기대효과 등을 고려하여 초거대 AI 도입을 결정함 ● 이후 도입을 위한 고려사항으로는 어떤 데이터로 초거대 AI를 학습시키고, 민감 데이터나 비공개 데이터의 학습 과정에서 외부 서비스 제공자(또는 모델)에 유출되지 않도록 설계하는 것이 중요함 ● 따라서 데이터의 보안 등급에 따른 보안대책을 마련하고, 나머지 절차에 따라 초거대 AI 서비스의 구조와 도입 방식 등을 검토해야 함 ※ 현재 ‘정부 망 보안정책 개선방안’을 관계기관 논의 중으로 향후 확정 시 추가 예정 그림 5 도입 절차 Part 3. 초거대 AI 도입 절차 29 3.2.1 데이터 보안 등급 ※ 현재 ‘정부 망 보안정책 개선방안’을 관계기관 논의 중으로 향후 확정 시 추가 예정 공공부문 초거대 AI 도입･활용 가이드라인 30 3.2.2 클라우드 서비스 구성 방안 ● 민간 클라우드 서비스 구성을 위한 도입 절차 1) 시스템을 운영할 클라우드 영역 및 컴퓨팅 리소스 규모를 선정함 - 데이터 및 시스템의 특성을 고려하여 클라우드 영역 및 LLM 도입위치 구분 - 데이터의 학습 방식과 컴퓨팅 리소스(CPU, GPU, 메모리, 스토리지) 등을 고려하여 인프라 규모를 결정 2) 클라우드 도입 유형에 따라 자원의 활용 방법을 검토하여 결정 - 도입하는 클라우드 자원을 기관 단독으로 사용하거나 타 기관과 공유하는지에 따라 자원 공유 방식을 결정 - 클라우드 자원의 통제 수준을 도입기관이 직접 물리적으로 통제하거나 위탁을 통해 관리하는지에 따라 통제 방식을 결정 Part 3. 초거대 AI 도입 절차 31 표 8 클라우드 서비스 도입 유형 구 분 주 요 내 용 퍼블릭 클라우드 (Public Cloud) - 클라우드 서비스 공급자가 서버 및 클라우드 리소스 제공 - 모든 기관 또는 사용자가 자원을 공유 프라이빗 클라우드 (Private Cloud) - 단일 조직에서 독점적으로 사용되는 컴퓨팅 리소스 제공 - 기관이 클라우드 자원의 통제권을 보유 멀티 클라우드 (Multi Cloud) - 여러 퍼블릭 클라우드를 함께 쓰는 방식 - 안정성 확보를 위한 클라우드 분산 운영이 필요한 조직에 적합 3) 이용 중인 정보자원이 있을 경우 전환･재구축 방안을 검토하여, 신규 시스템에 필요한 정보 자원 규모 산정에 함께 고려함 4) CSAP 인증 등에 기반한 보안성, 비용 효율성, 안정성, 향후 확장성 등을 고려하여 클라우드 컴퓨팅 서비스를 선정함 ● 모델 구성 방법에 따른 유의사항 - 파인튜닝과 사후학습 모델은 추가적인 컴퓨팅 자원이 필요함 - 데이터 추가학습 시 데이터의 유출을 방지할 수 있도록 보안에 유의해야 함 고려사항 ● 민간 클라우드 서비스(IaaS, PaaS, SaaS) 도입의 필요성 - 새로운 인프라와 LLM을 구축하는 것이 아닌 민간에서 이미 개발된 LLM을 클라우드 영역내에 도입함으로써 모델 개발에 필요한 시간과 컴퓨팅 리소스를 절감할 수 있음 - 입찰 용역 방식은 시스템 단위로 개발되어 기능별 재사용 및 고도화에 한계가 있는 반면, 이미 상용화된 서비스는 그대로 구매하여 서비스 적시 도입에 따른 파급효과와 공공시스템의 효율성을 높일 수 있음 ● 멀티 클라우드 방식 - LLM의 종류와 위치, 망 보안정책에 따라 멀티 클라우드의 구성도 가능 - 공개 데이터로 학습된 LLM으로 공통부분을 담당하고, 비공개 데이터로 학습된 sLLM을 따로 구성하여 멀티 클라우드로 구성할 수도 있음 - 기관의 특성과 용도에 맞는 LLM을 선택하듯 클라우드도 복수의 벤더를 선택하여 적합한 제품으로 구성할 수 있음 공공부문 초거대 AI 도입･활용 가이드라인 32 ● 정부 전용 초거대 AI 구현 방안(예시) - 정부 전용 초거대 AI는 민간에서 개발된 사전학습 모델을 정부 전용으로 활용할 수 있도록 공용 파운데이션 모델로 제공하는 방식임 - 기관의 초거대 AI 서비스 개발에 필요한 공용 클라우드컴퓨팅 자원과 표준 개발 및 운영 도구 등을 제공하고, DPG HUB 인프라와 연계됨 - 유형 1) 사전학습된 민간 언어모델(LLM A)을 추가학습 없이 그대로 사용하는 방식 - 유형 2) 사전학습된 민간 언어모델(LLM B)에 파인튜닝을 진행하여 사용하는 방식 ※ 개념도에 제시한 유형 외에 다양한 LLM 유형을 구성할 수 있음 그림 6 목표시스템 개념도 Part 3. 초거대 AI 도입 절차 33 3.2.3 데이터 학습 방식 ● 데이터 학습 방식에 따른 LLM 유형은 크게 파운데이션 모델, 파인튜닝된 모델, 사후학습된 모델로 구분할 수 있음 그림 7 학습방식에 따른 LLM 유형 ① 파운데이션 모델 - 추가학습을 하지 않고 범용 LLM을 그대로 사용하는 모델 - GPT, BERT 등 LLM의 사전학습(Pre-trained) 모델로 추론 속도, 리소스 측면의 제약이 없을 때 사용할 수 있음 - 대규모 말뭉치로 사전학습 되어 일반적인 작업에 사용 가능하며, 추가학습없이 다양한 자연어 생성 작업을 할 수 있음 - (장점) API로 연결하면 서비스(텍스트 생성, 번역, 요약, 질의 응답 등)를 바로 사용할 수 있고, 별도의 학습 과정이 필요하지 않아 추가 비용이 필요 없음 - (단점) 특정 용도에 최적화되어 있지 않아 전문성을 갖기에는 성능적 한계가 있음 공공부문 초거대 AI 도입･활용 가이드라인 34 ② 파인튜닝된 모델 - 문장 요약, 분류, 감정 분석 등 구체적인 작업 수행을 위해서 작업과 관련된 데이터로 파인튜닝 작업을 수행한 모델 - 모델의 전문성 확보를 위해 특별히 선별된 데이터로 파라미터의 미세조정을 수행함 - (장점) 특정 데이터를 추가로 학습시켜 사용자의 요구에 최적화된 성능을 기대할 수 있음 - (단점) 파운데이션 모델을 파인튜닝을 하는데 필요한 컴퓨팅 리소스, 인력, 시간이 투입 되어야 하므로 추가 비용이 필요함 ③ 사후학습된 모델 - 기술, 법률, 특허 등 최신 정보를 활용하는 모델로 사용하기 위해 사후학습을 수행한 모델 - 모델의 최신성과 전문성 확보를 위해 대량의 데이터로 추가학습하며, 파운데이션 모델에서 학습된 지식을 보존하면서 파운데이션 모델 자체를 고도화하는 방식임 - (장점) 대량의 데이터로 추가학습된 모델은 보다 전문성있는 성능을 기대할 수 있음 - (단점) 파운데이션 모델을 대량의 데이터로 추가학습시키는데 상당한 시간이 필요하고, 파인튜닝보다 많은 컴퓨팅 리소스가 필요함 고려사항 ● 파인튜닝된 모델이나 사후학습된 모델은 추가학습을 위해 추가적인 데이터 준비와 학습을 위한 데이터 전처리 과정이 필요 ● 추가학습된 모델은 목표한 성능을 갖추었는지 검증이 필요 ● 추가학습된 모델로 서비스할 수 있도록 추가적인 배포 필요 ● 배포된 모델의 정상적인 동작 여부 및 성능 분석을 위한 모니터링 필요 Part 3. 초거대 AI 도입 절차 35 ● LLM 유형 결정을 위한 순서 표 9 LLM 유형별 주요내용 구 분 주 요 내 용 파운데이션 모델 사용 목적 일반적인 목적으로 사용하는 유형 학습 데이터 자체 보유 데이터가 없어도 사용 가능 작업 유형 텍스트 생성, 문장 완성 등 질의 응답 능력을 기반으로 하는 작업 학습시간･ 컴퓨팅자원 추가적인 데이터 수집과 학습 과정이 없기 때문에 빠르게 구축 및 사용 가능 파인튜닝된 모델 사용 목적 문장 분류, 감정 분석 등 구체적인 작업 학습 데이터 특정 작업과 관련된 소량의 데이터 확보 필요 작업 유형 특정 작업과 관련된 문맥이나 패턴 이해를 기반으로 하는 작업 학습시간･ 컴퓨팅자원 주기적인 추가학습 인프라가 필요하므로 파운데이션 모델보다 상대적으로 많은 자원을 소요 사후학습된 모델 사용 목적 최신 정보와 성능을 필요로 하는 전문 작업 학습 데이터 최신성, 전문성과 관련된 대량의 데이터 확보 필요 작업 유형 파운데이션 모델을 최신화, 전문화한 다양한 작업 학습시간･ 컴퓨팅자원 대규모의 추가적인 학습 인프라가 필요하므로 파운데이션 모델이나 파인튜닝보다 상대적으로 많은 자원을 소요 공공부문 초거대 AI 도입･활용 가이드라인 36 - LLM은 사용 목적을 명확히 하는 과정을 통해서 유형을 결정함 - 적용하고자 하는 업무의 목적과 개선할 기능, 수준을 설정하고 작업 유형별로 상세화하여 초거대 AI를 도입할 수 있는 부분을 찾음으로써 어떠한 유형의 LLM을 활용할 수 있는지 결정할 수 있음 고려사항 ● 제공하고자 하는 서비스에 따라 적합한 LLM 유형을 선정 - 1장에서 제시한 국내 초거대 AI 서비스 현황 이외에도 다양한 LLM이 존재하고, 기업마다 제공하는 모델의 규모･성능･특성이 다름 - 모델 선택을 위해서는 가장 먼저 초거대 AI 도입 목적 등 용도를 분명히 하고, 기관의 업무적 특성과 가용한 자원의 크기를 고려하여야 함 - LLM과 sLLM은 양자택일의 문제가 아니라 공통부분은 LLM을 이용하고, 분야 별로 특화된 부분만 sLLM을 이용하는 하이브리드 형태로의 구성도 가능함 ● 학습을 위한 데이터셋 구축 준비 - 말뭉치(Corpus), 지도형 미세조정(SFT, Supervised Fine Tuning), 보상 모델 (RM, Reward Model) 등 데이터셋을 구축하여 사전학습 및 미세조정 진행 - 내부 데이터의 학습 및 사용자 질의에는 비공개 데이터의 유출 방지를 위해 적합한 보안 대책을 수립하여야 함 - 모델의 성능 향상과 최신 정보 및 정책적 여건 반영을 위해서는 일정한 주기로 추가학습 진행을 고려하여야 함 - 개정 법률 등과 같은 데이터는 시간에 따라 기존 학습데이터와 모순된 정보를 가질 수 있으므로 시간정보와 연동한 학습 필요 - 데이터의 학습 기간에만 사용되는 고성능 연산 자원과 운영을 위해 필요한 상시 자원을 구분하여 효율적인 인프라를 구성 운영해야 함 Part 3. 초거대 AI 도입 절차 37 3.2.4 서비스 도입 방식 ● 데이터 보안 등급부터 학습비용, 사용료, 운영비 등 기관의 상황을 고려하여 서비스 구매 방식과 조달 발주 방식으로 초거대 AI 도입을 추진할 수 있음 표 10 도입 방식별 주요내용 구 분 서비스 구매 방식 조달 발주 방식 정의 완성된 서비스를 원하는 만큼 이용 일반경쟁 입찰절차에 따라 용역계약 추진 절차 디지털서비스 검색 → 적합한 서비스 선택 → 계약조건 협의 →계약 및 납품 조달요청 → 구매규격 사전공개 → 입찰 공고 → 낙찰자 선정 → 계약 및 납품 차이점 계약 이용 중심 신속한 계약 절차 수의계약, 카탈로그 계약 등 가능 기업의 서비스를 심사‧등록 후 이용 ↔ ↔ ↔ ↔ 용역 소유 중심 긴 공고기간 및 계약 절차 경쟁 입찰 계약 기업이 요구사항에 맞는 서비스를 제안 ● ‘서비스 구매 방식’이란 계약에만 수개월이 소요되는 정부 계약 방식을 개선하여 적합한 서비스를 신속하게 도입할 수 있는 디지털서비스 전문계약제도를 말하는데, 기술이 급변하는 초거대 AI 활용에 유용한 방식으로 디지털서비스 이용지원시스템(www.digitalmarket.kr) 또는 디지털서비스몰(digitalmall.g2b.go.kr)을 통해 이용 가능함 ● 디지털서비스 이용지원시스템에서는 클라우드컴퓨팅서비스, 클라우드지원서비스, 융합서비스 등 3가지 유형으로 간소화된 계약 절차를 통해 공급업체･수요기관의 편의성을 제공 표 11 디지털 서비스 유형별 주요내용 구 분 주 요 내 용 클라우드 컴퓨팅서비스 SaaS, PaaS, IaaS와 같은 형태로 클라우드컴퓨팅을 활용 하여 상용으로 타인에게 정보통신자원을 제공하는 서비스 클라우드 지원서비스 클라우드 지원, 컨설팅, 운영관리, 마이그레이션 등과 같은 형태로 클라우드컴퓨팅서비스를 지원하는 서비스 융합서비스 다른 기술･서비스와 클라우드 컴퓨팅기술을 융합한 서비스 공공부문 초거대 AI 도입･활용 가이드라인 38 ● 디지털서비스를 제공하는 기업은 아래와 같은 심사신청 및 선정 절차를 거쳐 서비스를 등록 하고, 수요자는 시스템의 검색을 통해 서비스를 구매할 수 있음 그림 8 디지털서비스 구매절차 ● ‘조달 발주 방식’의 용역계약을 추진하면서 일부 단위 기능을 제공하는 독립된 모듈 형태의 서비스만 구매하는 방식으로도 가능 표 12 추진절차별 주요 검토사항 단계 추진 절차 세부 절차 구현 (y) 제안요청서 작성 - 요구사항 정의 - 대기업 참여제한 여부 확인 - 보안성 검토 - 소프트웨어 영향평가 - 적정사업기간 산정 - 사전협의 - 법제도/AI 윤리 검토 - 공공소프트웨어 과업심의위원회 경쟁입찰 발주 및 선정 - 사전규격 공개 - 입찰 공고 - 제안사 평가 및 선정 - 기술 협상 - 계약 Part 3. 초거대 AI 도입 절차 39 단계 추진 절차 세부 절차 구현 (y) 사업관리 - 분석/설계 - 구현/테스트 - 검사/준공 운영 예산 요구 운영 (y+1) 운영사업 발주/선정 운영 및 지속적 고도화 공공부문 초거대 AI 도입･활용 가이드라인 40 3.2.5 서비스 레벨 목표(SLO) ● 서비스 사용자와 제공자 간의 책임 소재를 명확히 하고 서비스 품질을 보장받기 위해서 구체적으로 측정 가능한 목표치 설정이 필요함 - 공공부문의 LLM 서비스에 적합한 평가 기준을 추가적으로 도입할 예정임. 아래에 제시된 예시 이외에도 구체적인 목표들을 고려해야 함 표 13 LLM 서비스 레벨 목표 주요 내용(예시) 구 분 주 요 내 용 BLEU (Bilingual Evaluation Understudy) ● 사람이 직접 번역한 문장과의 정확도 비교를 통한 품질 측정 응답 시간 (Response Time) ● 사용자 질의에 대한 LLM 응답 속도에 대한 목표 - 예) 문답 서비스의 90% 이상이 7초 이내 제공 - 예) 추론 서비스의 90% 이상이 10초 이내 제공 가용성 (Availability) ● LLM 서비스 가용/접근 가능 시간에 대한 목표 지표 - 예) 월 가용성 99.99% 데이터 보안 (Data Security) ● 사용자 데이터와 LLM 학습 데이터의 암호화/접근통제 수준 명시 윤리강령 준수 (Ethics Compliance) ● 편향 및 위험의 검증 절차 ● 제한 준수 규정 모델 업데이트 주기 (Model Update Cycle) ● 정기 모델 업데이트 주기 ● 모델 향상 주기 책임과 보상 체계 (Accountability & Compensation) ● 서비스 문제 발생 시 책임 소재 및 보상 체계 사용자 수용능력 (User Capacity) ● 동시 접속 가능한 최대 사용자 수 Part 3. 초거대 AI 도입 절차 41 구 분 주 요 내 용 기술 지원 (Technical Support) ● 기술 문의에 대한 지원 채널 제공 ● 지원 시간 및 초기 응답 시간 목표 문서화 (Documentation) ● 사용자 매뉴얼, API 문서, 튜토리얼 등의 제공 범위 ● 문서 업데이트 주기 테스트 절차 (Testing Protocol) ● 새 모델 배포 전 검증 프로세스 ● 테스트 관련 지표 설정 데모 서비스 (Demo Service) ● 유료 전환 전 무료 데모 서비스 기간 보장 사용 데이터 보고 (Usage Data Report) ● 사용량 및 성과 추이 데이터에 대한 정기 보고 기능 추가 및 업데이트 (Feature Addition & Update) ● 신기능 제안 수렴 및 개발 가능성 평가 절차 마련 ● 기능 추가 및 업데이트 주기 보장 오픈 API 지원 (Open API Support) ● 서드파티 서비스/앱 연동을 위한 API 제공 범위 커스터마이징 수준 ● 사용자 그룹 또는 용도에 맞는 모델 커스터마이징 지원 정도 라이선스 형태 (Licensing Scheme) ● 사용량 기반 라이선스 ● 기간별 라이선스 등의 조건 해지 정책 (Termination Policy) ● 계약 해지 시 데이터 처분, 모델 이전 등에 대한 정책 법적 준수 사항 (Legal Compliance) ● LLM 서비스의 법률 및 규제 준수에 대한 보장 정량 성과 지표 관리 (Quantitative Performance Metrics) ● 각 성과지표에 대한 모니터링 및 실적치 집계 공공부문 초거대 AI 도입･활용 가이드라인 42 3.2.6 유지보수 및 운영(Operations) ● LLM을 효율적으로 운영하기 위해서는 데이터 관리와 운영을 위한 조직 구성이 필요함 - 운영 조직은 데이터 준비, 모델 구축, 초기 설정, 사전학습, 추가학습, 교육, 배포, 모니터링, 최적화 등에 참여하고 데이터 보호 및 할루시네이션(환각) 예방 조치 등을 수행함 - 또한 LLM을 사용하는 전 과정에서 사용자의 피드백을 통해 파라미터를 재조정하고, 강화 학습을 하는 등 모델의 성능을 개선시키는 역할도 포함됨 - 강화학습 등을 통한 지속적인 모델 관리와 유지보수 및 운영을 위한 예산확보도 필요함 - 효과적인 성능 개선과 지속적인 기술 고도화를 위해서는 민간 전문가와의 협력체계 구성도 필요함 ● 초거대 AI를 효율적으로 활용하기 위해서는 데이터를 지속해서 관리할 조직과 이를 위한 거버넌스적 체계 마련이 필요함 - 내부적으로는 언어 모델의 규모와 비용 대비 성능 최적화를 위해 운영 중 발생하는 신규 데이터를 활용할 수 있도록 체계를 구성하는 것이 매우 중요함 - 외부적으로도 초거대 AI를 활용하면서 생길 수 있는 편향, 할루시네이션(환각), 악용 등 사회적･윤리적 문제에 대응하기 위해서도 필요함 ● 효과적인 운영을 위해 정책 기획, AI 기술, AI 윤리, 정보보안으로 부서별 역할을 나눌 수 있으며 조직 구성에는 기관의 특성을 반영함 표 14 초거대 AI 관련 거버넌스 구성안 구 분 주 요 내 용 기획총괄 부서 - 거버넌스 및 조직 구성 - 도입 비용 및 유지보수･운영 예산 수립 - 추진 체계(PDCA) 및 성과 관리 인공지능 기술 부서 - 데이터 관리 및 파라미터 설정 - 데이터 학습 방법 수립(사전학습, 추가학습 등) 및 모델 성능 점검 - 서비스 버전 관리 및 배포 - 서비스 모니터링(사용 인원, 사용횟수, 트래픽, 효과성 등) 인공지능 윤리 부서 - 편향･환각･거짓정보 등 위험성 대응 - 법･제도적 이슈 진단 - 사용 지침 수립 및 사용자 교육 정보보안 부서 - 정보보호, 취약점 분석 - 클라우드 연계 및 보안성 검토 Part 3. 초거대 AI 도입 절차 43 3.3 초거대 AI 도입 체크리스트 ● 행정･공공기관에서 초거대 AI를 공공부문에 도입할 경우 아래 예시의 도입 체크리스트를 참고하여 각 기관의 상황에 맞도록 활용하도록 제시함 0. 초거대 AI 서비스 도입 업무 결정 ☞ 3.1 도입 원칙 및 고려사항(P.26~27) 참조 - 대상 업무의 추진현황, 문제점 및 목표 분석 □ - 문제해결을 위한 신기술 활용 방안에 대한 적합성 검토 □ - 신기술 도입에 따른 기대효과 및 성과(정량‧정성) 분석 □ - 국정과제 등 정부 정책의 추진방향 검토 □ 1. 도입 업무의 보안등급 검토 ※현재 ‘정부 망 보안정책 개선방안’을 관계기관 논의 중으로 향후 확정 시 추가 예정 2. 클라우드 구성 방안에 따른 검토 ☞ 3.2.2 클라우드 서비스 구성 방안(P.30~32) 참조 2.1 민간 클라우드 직접 활용 - 클라우드 영역 및 인프라 규모 선정 검토 □ - 클라우드 도입 유형 결정(퍼블릭, 프라이빗, 멀티 클라우드) 검토 □ - 사업 추진방향(보유 자원과 신규 자원의 전환‧재구축 등) 검토 □ - 클라우드 벤더사의 제공 서비스(보안성, 비용효율성, 안정성, 확장성 등) 검토 □ 2.2 정부 전용 초거대 AI 인프라 활용 - ‘정부 전용의 초거대 AI 구현방안 정보화전략계획’ 검토 □ 3. 데이터 학습 방식에 따른 LLM 유형 결정 ☞ 3.2.3 데이터 학습 방식(P.33~36) 참조 3.1 LLM 사용 방식 결정 - 추가학습 없이 범용 LLM을 그대로 사용 □ 파운데이션 모델 (→ 체크리스트 3.2로 이동) - 기관의 정제된 일부 데이터로 추가학습 □ 파인튜닝 (→ 체크리스트 3.3로 이동) - 대량의 신규 데이터를 추가학습 □ 사후학습 (→ 체크리스트 3.4로 이동) 공공부문 초거대 AI 도입･활용 가이드라인 44 3.2 파운데이션 모델 - 대상 업무의 특성을 반영한 LLM 선정(파라미터 규모, 속도, 정확도 등) 여부 □ - 기관의 업무적 특성과 가용한 자원(인프라, 이용료 등) 파악 □ 3.3 파인튜닝 □ - 업무 특성을 반영한 LLM 선정(파라미터 규모, 속도, 정확도 등) 여부 □ - 기관의 업무적 특성과 가용한 자원(인프라, 이용료 등) 파악 □ - 추가학습을 위한 데이터 준비 여부 □ - 파라미터의 미세조정 및 기대 성능 모니터링 검토 □ - 데이터 유출 방지 및 보안 대책 마련 검토 □ - 모델 버전 관리 및 배포 방안 마련 검토 □ - 추가학습을 위한 컴퓨팅 자원 확보 검토 □ 3.4 사후학습 - 업무 특성을 반영한 LLM 선정(파라미터 규모, 속도, 정확도 등) 여부 □ - 기관의 업무적 특성과 가용한 자원(인프라, 이용료 등) 파악 □ - 추가학습을 위한 데이터 준비 여부 □ - 파운데이션 모델 고도화 및 기대 성능 모니터링 검토 □ - 데이터 유출 방지 및 보안 대책 마련 검토 □ - 모델 버전 관리 및 배포 방안 마련 검토 □ - 추가학습을 위한 컴퓨팅 자원 확보 검토 □ 4. 서비스 도입을 위한 방식 결정 ☞ 3.2.4 서비스 도입 방식(P.37~39) 참조 4.1 기관 및 업무 성격을 고려한 도입 방식 결정 - 완성된 서비스를 원하는 만큼 이용 □ 서비스 구매 방식 (→ 체크리스트 4.2) - 일반경쟁 입찰절차에 따라 용역계약 □ 조달 발주 방식 (→ 체크리스트 4.3) 4.2 서비스 구매 방식 - 계약제도 등록 및 요건 확인 □ - 제품 커스터마이징 여부 및 수의계약 확인 □ Part 3. 초거대 AI 도입 절차 45 4.3 조달 발주 방식 - 요구사항을 반영한 사업계획서 산출 검토 □ - 보안성 검토 등 사전절차 이행 검토 □ - 조달 요청을 통한 경쟁입찰 추진체계, 공고기간 등 확인 □ 5. 서비스 레벨 목표(SLO) 항목 검토 ☞ 3.2.5 서비스 레벨 목표(P.40~41) 참조 - 요구사항 및 목표 품질 명확화 검토 □ - 유사 서비스와의 벤치마크 비교 검토 □ - 운영 비용 및 계약 관련사항 검토 □ ☞ 체크리스트 항목(1~5)의 고려사항을 초거대 AI 도입 관련 사업계획서 내에 반영하였는지를 확인 6. 유지보수 및 운영(Ops) 방식 검토 ☞ 3.2.6 유지보수 및 운영(P.42) 참조 - 데이터 관리(강화학습, 파라미터, 배포 등)를 위한 운영 조직 구성 검토 □ - 언어 모델의 규모, 비용, 성능 최적화를 위한 시스템 모니터링 검토 □ - 지속적인 모델 관리와 유지보수 및 운영을 위한 예산확보 방안 검토 □ - 정보보호 및 취약점 분석 등 보안성 검토 □ - 중장기 운영계획 및 성과 관리 방안 수립 검토 □ - 사용 지침 수립 및 교육 등 내적 운영 방안 수립 검토 □ - 법‧제도적, 사회적 이슈 등 외적 요인 검토 □ - 인공지능 윤리 기준(편향‧환각‧거짓정보 등 위험성 대응 등) 검토 □ Part 3. 초거대 AI 도입 절차 47 PART 4 부록 (’23년 초거대 AI 활용 지원 사업 주요 현황) • 공공부문 초거대 AI 도입·활용 가이드라인 • 공공부문 초거대 AI 도입･활용 가이드라인 48 4 부록 (’23년 초거대 AI 활용 지원 사업 주요 현황) 『 ① 초거대 AI 기반의 도시철도 교통안전 GPT 서비스(서울교통공사) 』 ● (배경) 도시철도 교통안전을 위해서는 사고 예방과 선제적 대응이 중요하나 전문적이고 산재된 자료로 인해 안전관리자의 역량 및 중요성이 가중 ● (목표) 안전 관련 데이터 학습을 통해 업무 담당자들에게 실시간으로 정보를 제공하여 안전 전문성 향상 및 의사결정 시간 단축 ● 모델 학습 절차 - 산업 안전 관련 법령, 교통공사 사규, 안전 매뉴얼 등 22,889건 자료 - ① 데이터수집 및 학습데이터 전처리 → ② 학습모델 생성 및 파인튜닝 → ③ 안전GPT 서비스 구현 및 학습모델 연계･테스트 ● 주요 서비스 ※ 유형1. 질의 응답 - (자료 검색) 안전 관련 데이터를 학습하여 근거 기반의 챗봇 기능 제공 - (현장 알림) 사고 발생 지역 GPS를 통한 관련 규정･지침 등 알림 기능 실증 ● 기대 효과 : 교통안전 등 특화 분야 맞춤형 챗봇 기능 도입 및 확장성 실증 <챗봇 기반 자료검색 화면> <사고 현장 알림 실증 화면> Part 4. 부록 49 『 ② 초거대 AI 기반의 공공기관 민원상담 어시스턴트 서비스(화성시) 』 ● (배경) 민원 대응을 위한 콜센터 상담원별 응답시간 및 대응 품질 일관성 부족 ● (목표) 민원 대응 초안 및 맞춤형 검색 시스템 개발 등 통한 민원상담 어시스턴트 서비스 개발 ● 모델 학습 절차 - (학습데이터) 화성시청 상담 매뉴얼, 서식 등 2,000여건 자료 - ① 데이터 수집 및 인덱싱 → ② 자연어 처리 및 LLM 연계 모듈 개발 → ③ 민원 상담 어시스턴트 서비스 구현 및 네이버의 하이퍼클로바X 연계･테스트 ● 주요 서비스 ※ 유형5. 상담 지원 - (초안 생성) 민원 대응을 위한 답변 초안 생성 및 근거 출력 - (강화 학습) 민원 대응 답변 초안에 대한 피드백을 통해 강화학습 이력 및 자료 확보 ● 기대 효과 : 상담 대기･처리 시간 단축 및 상담품질 향상 <민원대응 초안 생성 및 출처 표기 화면> 공공부문 초거대 AI 도입･활용 가이드라인 50 『 ③ 제안요청서 초안 생성 실증(조달청) 』 ● (배경) 분야별 다양한 제안요청서 양식, 전문성 부족 등으로 제안요청서 작성이 어려우며, 조달청의 검토에 많은 시간 소요 ● (목표) 분야별 제안요청서의 추진배경, 기대효과, 사업범위 등 초안 생성 실증 ● 모델 학습 절차 - 인공지능, 빅데이터, 클라우드 등 특정 분야 제안요청서 900건 자료 - ① 학습데이터 셋 구축 → ② RFP 초안 생성 모델 추가 및 파인튜닝 → ③ 3개 분야 검색이 가능한 데모페이지 개발 및 모델 연계 ● 주요 서비스 ※ 유형3. 문서 작성 - 문서 형식, 분야, 제목, 목차, 핵심 키워드를 입력받아서 목차 기반의 초안 생성 <제안요청서 초안 생성 POC 실증 화면> Part 4. 부록 51 『 ④ 홈택스 종합소득세 분야 챗봇 실증(국세청) 』 ● (배경) 국세청의 홈택스 이용자 편의를 위한 종합소득세 문의 챗봇의 유연성과 정확도 부족 ● (목표) 하이퍼클로바X(LLM)를 기반으로 종합소득세 분야 챗봇 고도화 실증 ● 모델 학습 절차 - 국세청의 종합소득세 시나리오 관련 항목, 질문, 답변 형태의 16,000건의 데이터 입력 - ① RAG 기반의 학습데이터 셋 구축 → ② 하이퍼클로바X 모델 연계 및 파인튜닝 → ③ 종합소득세 시나리오 기반의 챗봇 데모페이지 제공 ● 주요 서비스 ※ 유형5. 상담 지원 - 종합소득세 시나리오에 특화된 초거대 인공지능 기반의 챗봇 서비스 제공 <클로바 스튜디오 내 모델 테스트> <챗봇 POC 실증 화면> 공공부문 초거대 AI 도입･활용 가이드라인 52 『 ⑤ 맞춤형 뉴스 리포터 제공 실증(국회도서관) 』 ● (배경) 기존 뉴스 리포트의 경우 고객이 원하는 뉴스 그룹에 대한 분석과 다양한 시간대 분석이 어려우며, 자동화 과정은 많은 비용 소요 ● (목표) 대표성을 가지는 각 그룹(클러스터)별 이슈키워드 생성 및 데일리 리포트 제공 ● 모델 학습 절차 - 그룹별 뉴스 리포트 약 1,000건의 자료 - ① 학습데이터 셋 구축 및 전처리 → ② 이슈 키워드 생성 모델 개발 및 파인튜닝 → ③ 일별/시간별 NewsDigest 결과를 API로 제공 ● 주요 서비스 ※ 유형2. 분석･활용 - (이슈 키워드 생성) 뉴스 그룹의 대표성을 가질 수 있는 키워드 생성 - (데일리 뉴스 리포트) 주요 섹터 뉴스에 대한 NewsDigest 결과 제공 ● 기대 효과 : 원하는 뉴스를 대상으로 NewsDigest 기반의 데일리 리포트 제공 <NewsDigest 데모 서비스 화면> Part 4. 부록 53 『 ⑥ 국민신문고 민원 분류 적중률 고도화 실증(국민권익위원회) 』 ● (배경) 국민신문고의 민원 처리기관 추천 시스템의 낮은 적중률으로 민원 담당자 업무량 증가 ● (목표) 민원 유형에 따른 부처‧부서 분류 모델 개발 및 생성형 AI 기반 요약 모델 실증 ● 모델 학습 절차 - 처리기관과 처리 부서 분류 데이터 및 민원 데이터(특정 지역･기간의 14,000여건 자료) - ① 학습데이터 셋 구축 및 전처리 → ② 분류/요약 모델 개발 및 파인튜닝 → ③ 민원 분류 및 요약 모델 데모페이지 제공 ● 주요 서비스 ※ 유형2. 분석･활용 - (부처‧부서 분류 기능) 높은 정확도의 민원 담당 부처 부서 추천 기능 제공 - (민원 핵심 요약 추출 기능) 직접적인 민원 요청 정보 추출 기능 제공 ● 기대 효과 : 분석 대상 범위의 전국 확대, 분류 요약 모델의 성능 고도화 <민원 분류 실증 화면> <민원 요약 실증 화면> 공공부문 초거대 AI 도입･활용 가이드라인 54 『 ⑦ 부동산 건축 분야 스마트검색 및 챗봇 실증(한국부동산원) 』 ● (배경) 건축 관련 질의 민원이 발생하고 있으나, 민원 담당 인력이 부족한 상황 ● (목표) 민원 응답 시스템 개발 및 민원 검색 서비스 개발을 통한 민원 부담 감소 ● 모델 학습 절차 - 건축법, 생활법령과 같은 법률 문서 pdf 자료 - ① 데이터 수집 및 학습데이터 전처리 → ② 학습모델 개발 및 파인튜닝 → ③ 민원 응답 SmartChat/SearchGPT 서비스 구현 및 학습모델 연계･테스트 ● 주요 서비스 ※ 유형5. 상담 지원 - (챗봇 기능) 민원 및 건축 관련 정보에 대한 SmartChat 기반 챗봇 서비스 제공 - (검색 서비스) 각종 법령이나 민원 응답과 같은 SearchGPT 기반 정보 검색 기능 제공 ● 기대 효과 : 과거의 민원 정보를 쉽게 찾아줄 수 있는 검색 및 챗봇 서비스 지원 <SmartChat 기반 챗봇 서비스 화면> <SearchGPT 기반 검색 서비스 화면> Part 4. 부록 55 『 ⑧ 취업규칙 준수 여부 판단 기능 실증(고용노동부) 』 ● (배경) 취업규칙의 잦은 변경으로 예전 취업규칙 법령 내용을 혼동하는 사례가 빈번하게 발생 ● (목표) 신고된 취업규칙이 법･규정을 준수하고 있는지 여부를 판단하는 AI 모델 개발 ● 모델 학습 절차 - 취업규칙 관련 법/규정 관련 데이터 - ① 데이터 수집 및 학습데이터 전처리 → ② 취업규칙 판단 모델 개발 및 파인튜닝 → ③ 취업규칙 판단 서비스 구현 및 학습모델 연계･테스트 ● 주요 서비스 ※ 유형2. 분석･활용 - (판단 기능) 취업규칙 검토시 적합･부적합 여부 판단 기능 제공 ● 기대 효과 : 법 위반사항 검토, 계약서 작성 등 공공기관 유사 업무 확대 적용 <취업규칙 기반 적합 판단 여부 결과 화면> 공공부문 초거대 AI 도입･활용 가이드라인 56 『 ⑨ 월드잡플러스 대시민 응대 및 업무 지원을 위한 AI 실증(한국산업인력관리공단) 』 ● (배경) 월드잡플러스 서비스 사용자의 언어 다양성으로 민원에 대한 인적･물적 자원 부담 ● (목표) 해외 구직자 대상 초거대 AI 모델 기반 챗봇 해외 취업 지원 서비스 제공 ● 모델 학습 절차 - 월드잡플러스 문의 게시판, 공고 등 관련 문서 기반의 QnA 문의 954개 데이터쌍 - ① 학습데이터 셋 구축 및 전처리 → ② 학습 모델 개발 및 파인튜닝 → ③ GPT 모델 기반 챗봇 서비스 구현 및 학습모델 연계･테스트 ● 주요 서비스 ※ 유형4. 기획･창작 - (민원 응대 기능) 서비스 이용자를 위한 민원 응대 기능 제공 - (다국어 이력서 기반 생성 기능) 다국어 이력서 기반 생성 및 첨삭 기능 제공 ● 기대 효과 : 다국어 지원이 가능한 이력서 첨삭 기능 대민 서비스 구현 <다국어 모의 질문 기반 챗봇 서비스 화면> <다국어 이력서 첨삭 서비스 화면> Part 4. 부록 57 『 ⑩ 국민연금 일시금 분야 민원 대응 AI 휴먼 실증(국민연금공단) 』 ● (배경) 공단 콜센터 상담 내용 대응 및 요약 등 기능 및 민원 대응 컨시어지 필요 ● (목표) Mi:dm(LLM) 기반의 일시금 분야 질의응답 기반의 AI 휴먼 서비스 실증 ● 모델 학습 절차 - 국민연금공단의 일시금 관련 지침, 공문, 가이드 등 1,000개 이상 문건 - ① 학습데이터 셋 구축 → ② Mi:dm 모델 연계 및 파인튜닝 → ③ 일시금 관련 민원 대응 기반의 챗봇 기능 개발 → ④ AI 휴먼과 연계하여 서비스 테스트 ● 주요 서비스 ※ 유형6. 서비스 처리 - 국민연금공단의 연금 일시금 관련 민원 대응을 위한 AI 휴먼 서비스 실증 <일시금 관련 문의 대응 AI 휴먼 테스트> 공공부문 초거대 AI 도입･활용 가이드라인 2024년 4월 발행 발 행 처 : 디지털플랫폼정부위원회 지원기관 : 한국지능정보사회진흥원 ※ 이 가이드라인은 디지털플랫폼정부위원회 및 한국지능정보사회진흥원의 허락없이 무단으로 가공할 수 없습니다.

Full text