pixel

AI의 효과적 활용을 위해 알아야 할 용어 10가지

2022년 말 생성형 AI가 주류로 급부상한 이후, 대부분의 사람들은 생성형 AI와 자연어를 사용하여 컴퓨터와 더 쉽게 상호작용하는 방법에 대해 기본적인 이해를 갖게 되었습니다. “프롬프트”나 “머신러닝”은 이제 친구와 커피를 마시며 나누는 가벼운 대화 주제가 되었죠. (아직 잘 모르겠다면, “모두가 알아야 할 10가지 AI 용어“라는 소개 기사를 읽어보세요.) 그러나 AI가 계속 진화함에 따라 AI 용어도 발전합니다. 대형 언어 모델(LLM)과 소형 언어 모델(SLM)의 차이를 알고 계신가요? ChatGPT에서 “GPT”가 무엇을 의미하는지 아시나요? 또는 RAG가 허구를 정리하는 것과 무슨 관련이 있는지 아시나요? 여러분이 최신 AI 용어를 이해할 수 있도록 도와드리겠습니다.

추론/계획(Reasoning/Planning)

AI를 사용하는 컴퓨터는 이제 역사적 데이터를 통해 학습한 패턴을 이용하여 정보를 이해하고 문제를 해결하며 작업을 수행할 수 있습니다. 가장 발전한 시스템은 현재에서 한 단계 더 나아가 목표를 달성하기 위한 일련의 행동을 계획하여 점점 더 복잡한 문제를 해결하는 능력을 보이고 있습니다. 예를 들어, 테마파크 여행을 계획하는 데 도움을 요청하면, AI 시스템은 목표-6개의 서로 다른 놀이기구를 타고, 가장 더울 때 물놀이를 하는 등-를 달성하기 위한 일정을 단계별로 분해하고, 추론을 사용하여 다른 곳으로 두 배로 돌아가지 않도록 하고 정오에서 오후 3시 사이에 워터 슬라이드를 타도록 하는 것이죠.

훈련/추론(Training/Inference)

AI 시스템을 만들고 사용하는 데는 훈련추론, 두 단계가 있습니다. 훈련은 AI 시스템의 교육과 비슷하며, 데이터 세트를 제공받아 해당 데이터 기반으로 작업을 수행하거나 예측하는 방법을 배우는 단계입니다. 예를 들어, 최근에 판매된 주택 가격 목록과 침실 및 욕실 수 등 다양한 변수를 제공받을 수 있습니다. 훈련 중에 시스템은 가격 결정에 영향을 미치는 각 요소에 얼마만큼의 가중치를 부여할지 결정하는 값인 내부 매개변수를 조정합니다. 추론이란 학습된 패턴과 매개변수를 사용하여 시장에 출시될 새 주택에 대한 가격 예측을 도출하는 것입니다.

SLM(Small Language Model)

소형 언어 모델(SLM)은 대형 언어 모델(LLM)의 소형 버전입니다. 두 모델 모두 기계 학습 기술을 사용하여 패턴과 관계를 인식하고 현실적이고 자연스러운 언어 응답을 생성합니다. LLM은 매우 크고 많은 계산 능력과 메모리가 필요한 반면, Phi-3와 같은 SLM은 작은 데이터 세트로 훈련되고 매개변수가 적어 더 컴팩트하며 인터넷 연결 없이도 사용할 수 있습니다. 이는 노트북이나 휴대폰 같은 기기에서 간단한 질문에 답하는 데 적합합니다. 따라서 애완동물 관리에 대한 기본적인 질문을 할 수 있지만 눈이 보이는 개를 훈련시키는 방법에 대한 자세한 다단계 추론까진 필요없는 노트북이나 휴대폰과 같은 장치의 앱에 적합합니다.

현실 연결(Grounding)

생성형 AI 시스템은 이야기, 시, 농담을 만들고 연구 질문에 답할 수 있습니다. 그러나 때때로 사실과 허구를 구분하는 데 어려움을 겪거나 훈련 데이터가 오래되어 부정확한 응답을 하기도 합니다. 이를 환각 현상(hallucination)이라고 합니다. 개발자들은 현실에 대한 정확한 상호작용을 위해 모델을 데이터와 구체적인 예로 연결하고 고정시키는 과정인 ‘그라운딩‘을 통해 정확성을 높이고 맥락에 맞고 개인화된 결과값을 도출하도록 돕습니다.

검색 증강 생성(RAG)

개발자가 AI 시스템에 더 정확하고 최신 정보를 제공하기 위해 ‘그라운딩 소스’에 접근할 수 있게 하는 방법을 검색 증강 생성(RAG)이라고 합니다. RAG 패턴은 AI 프로그램을 재훈련하지 않고도 추가 지식을 제공하여 시간과 자원을 절약합니다. 예를 들어, 의류 회사를 운영하면서 상품에 대한 질문에 답할 수 있는 챗봇을 만들고 싶다면, RAG 패턴을 사용하여 제품 카탈로그를 기반으로 고객이 원하는 녹색 스웨터를 찾을 수 있도록 도울 수 있습니다.

조정(Orchestration)

AI 프로그램은 사용자 요청을 처리할 때 많은 작업을 수행해야 합니다. 조정 레이어는 최적의 응답을 얻기 위해 모든 작업을 올바른 순서로 안내합니다. 예를 들어, Microsoft Copilot에게 Ada Lovelace에 대해 묻고, 이어서 그녀가 언제 태어났는지 묻는다면, AI의 조정기는 후속 질문의 “그녀”가 Lovelace를 가리킨다는 것을 인식합니다. 조정 레이어는 또한 RAG 패턴을 따름으로써 인터넷에서 새로운 정보를 검색하여 문맥에 추가하고 모델이 더 나은 답을 찾을 수 있도록 도울 수 있습니다. 그것은 마치 거장이 바이올린에 신호를 보낸 다음 플루트와 오보에가 모두 악보를 따라 작곡가가 염두에 둔 사운드를 생성하는 것과 같습니다.

메모리(Memory)

오늘날의 AI 모델은 기술적으로 메모리가 없습니다. 그러나 AI 프로그램은 특정 단계에 따라 이전 질문과 답변을 일시적으로 저장하고 현재 요청에 그 맥락을 포함시켜 정보를 “기억“하도록 할 수 있습니다. 예를 들어, RAG 패턴의 데이터를 사용하여 최신 정보를 제공할 수 있죠. 개발자들은 AI 시스템이 단기적으로 기억해야 하는지, 예를 들어 포스트잇 메모처럼, 아니면 더 오랜 기간 동안 영구적으로 기억하는 것이 유용한지를 판단할 수 있도록 조정 레이어를 실험하고 있습니다.

트랜스포머 모델과 확산 모델(Transformer Models and Diffusion Models)

수십 년 동안 사람들은 AI 시스템이 언어를 이해하고 생성하도록 가르쳐왔지만, 최근 발전을 가속화한 돌파구 중 하나는 트랜스포머 모델이었습니다. 생성형 AI 모델 중에서 트랜스포머는 맥락과 뉘앙스를 가장 잘 이해하고 빠르게 처리합니다. 트랜스포머는 데이터의 패턴을 주의 깊게 살펴보고, 다양한 입력의 중요성을 평가하여 다음에 올 내용을 예측하고 텍스트를 생성합니다. 트랜스포머의 대표적인 예로는 ChatGPT의 “T”인 생성형 사전 학습 트랜스포머(Generative Pre-Trained Transformer)가 있습니다. 확산 모델은 주로 이미지 생성에 사용되며, 무작위 위치에서 픽셀을 점진적으로 분산시켜 요청된 이미지를 형성합니다. 확산 모델은 작은 변화를 반복하여 원하는 이미지를 만듭니다.

프론티어 모델(Frontier Models)

프론티어 모델은 AI의 경계를 확장하며 다양한 작업을 수행할 수 있는 대규모 시스템입니다. 이 모델은 때로는 예상치 못한 능력을 보여주기도 합니다. Microsoft를 포함한 기술 회사들은 지식을 공유하고 안전 기준을 설정하며 강력한 AI 프로그램의 안전하고 책임 있는 개발을 보장하기 위해 프론티어 모델 포럼을 결성했습니다.

GPU

GPU는 Graphics Processing Unit의 약자로, 기본적으로 터보과급기가 적용된 계산기입니다. 원래 비디오 게임의 화려한 그래픽을 부드럽게 표현하기 위해 설계되었지만, 이제는 컴퓨팅의 고성능 자동차 역할을 합니다. GPU는 수많은 작은 코어, 회로 및 트랜지스터 네트워크의 병렬 처리를 통해 수학 문제를 함께 해결합니다. AI는 인간 언어로 소통하고 이미지나 소리를 인식하기 위해 대규모로 많은 계산을 해결하는 것이기 때문에, GPU는 AI 도구의 훈련과 추론에 필수적입니다. 오늘날 가장 진보된 모델들은 수천 개의 GPU로 구성된 대규모 클러스터를 사용하여 훈련됩니다. Microsoft의 Azure와 같은 데이터 센터는 세계에서 가장 강력한 컴퓨터 중 하나입니다.

클라우드 기반의 데이터 및 인공지능 서비스 컨설팅이 필요하다면 클루커스에 문의하세요
Secured By miniOrange