본문 바로가기

Trend

AI 용어 정리 1편 - 인공지능 관련 핵심 용어 완전 정복

AI 용어 정리 - 인공지능 관련 핵심 용어 완전 정복

AI 기술이 빠르게 발전하면서 다양한 전문 용어들이 등장하고 있습니다. 아래는 AI/머신러닝/딥러닝/LLM 등의 분야에서 자주 사용되는 용어들을 정리한 자료입니다. 실무자, 기획자, 개발자, 학생 모두에게 도움이 되도록 최대한 자세히 설명합니다.


1. LLM (Large Language Model)

정의: 대규모 텍스트 데이터를 학습하여 인간과 유사한 언어 이해 및 생성 능력을 갖춘 인공지능 언어 모델입니다.

대표 모델: GPT (OpenAI), Claude (Anthropic), Gemini (Google), LLaMA (Meta)

사용 도구: Hugging Face Transformers, OpenAI API, LangChain, LlamaIndex

활용 분야: 챗봇, 요약, 번역, 코드 생성, 검색 최적화, 문서 생성 등

2. 파인 튜닝 (Fine-tuning)

정의: 사전 학습된 AI 모델에 사용자 정의 데이터셋을 추가 학습시켜 특정 도메인에 특화된 결과를 도출하는 방법입니다.

관련 툴: Hugging Face, LoRA, PEFT, OpenAI fine-tuning API

사용 사례: 의료/법률/고객지원 분야에서 맞춤형 챗봇 제작, 특정 용어/화법 반영

3. 프롬프트 엔지니어링 (Prompt Engineering)

정의: LLM에게 원하는 응답을 유도하기 위해 질문(prompt)을 정교하게 설계하는 기술입니다.

활용 도구: OpenAI Playground, PromptLayer, FlowGPT, PromptPerfect

팁: "너는 이제 전문가다", "아래 문단을 3줄로 요약해줘"와 같이 명확하고 단계적으로 질문

4. 임베딩 (Embedding)

정의: 텍스트나 이미지 등의 데이터를 벡터(숫자) 형태로 변환하여 의미를 보존한 채 계산에 사용할 수 있도록 하는 기법입니다.

사용 도구: OpenAI Embedding API, SentenceTransformers, Pinecone, FAISS

활용 분야: 유사 문서 검색, 추천 시스템, 벡터 검색 기반 QA 시스템

5. 벡터 데이터베이스 (Vector Database)

정의: 임베딩 벡터 형태의 데이터를 저장하고 유사도를 기반으로 검색할 수 있는 특화된 데이터베이스입니다.

대표 제품: Pinecone, Weaviate, Milvus, Chroma, Qdrant

활용: RAG 기반 검색 시스템, 추천 서비스, 실시간 문서 검색

6. RAG (Retrieval-Augmented Generation)

정의: LLM에 외부 지식을 결합하여 정답을 생성하도록 돕는 아키텍처. 벡터 검색 결과를 모델 입력에 포함시켜 응답 정확도를 높임.

사용 도구: LangChain, LlamaIndex, OpenAI, Pinecone

활용: 사내 문서 기반 챗봇, 실시간 FAQ, 지식 검색형 챗봇 구축

7. 오픈소스 LLM

정의: 누구나 사용할 수 있도록 소스코드와 모델을 공개한 대규모 언어 모델

대표 모델: LLaMA (Meta), Mistral, Falcon, BLOOM

사용 사례: 자체 서버 구축, 비용 절감, 커스터마이징 자유도 확보

8. Zero-shot / Few-shot 학습

Zero-shot: 예시 없이 바로 문제를 해결하는 방식

Few-shot: 몇 개의 예시(문제-답)를 주고 해결하는 방식

활용: 프롬프트 설계, 다양한 태스크 수행 시 유연성 확보

9. 에이전트 (AI Agent)

정의: LLM이 여러 도구와 API를 조합하여 스스로 문제 해결과 반복 작업을 자동화하는 프레임워크 또는 개념

관련 툴: LangChain Agent, AutoGPT, OpenAI GPT Agent, CrewAI

활용: 자동 이메일 응답, 일정 예약, 문서 생성, 워크플로 자동화

10. LangChain

정의: 다양한 LLM, 도구, 검색 시스템 등을 연결하여 복잡한 AI 애플리케이션을 구축할 수 있는 오픈소스 프레임워크

특징: 체인, 에이전트, 메모리, 툴 연동 기능 제공

활용: FAQ 챗봇, 문서 QA 시스템, 대화형 분석 서비스 등

11. LlamaIndex (구 GPT Index)

정의: LLM이 외부 문서(문서, PDF, 데이터베이스 등)를 잘 이해할 수 있도록 인덱싱하고 쿼리를 수행하는 프레임워크

활용: 기업 데이터 기반 QA, 검색 보조 챗봇

12. 토큰 (Token)

정의: LLM이 텍스트를 처리할 때 사용하는 최소 단위. 단어, 어근, 구두점 등이 될 수 있음.

예시: "AI is great" → 3개의 토큰

중요성: 토큰 수에 따라 요금이 청구되며, 모델의 입력/출력 제한도 존재함.


계속 추가 예정: 이외에도 Self-hosting, Guardrails, LoRA, PEFT, RLHF, Chain-of-thought 등 수많은 AI 용어들이 존재하며, 관련 내용은 블로그에 지속 업데이트될 예정입니다.

※ 본 콘텐츠는 실무/학습에 바로 활용할 수 있도록 구성되었으며, AI 트렌드를 파악하거나 시스템 설계 시 용어 이해에 큰 도움이 됩니다.

 

 

 

위의 글은 AI 도움을 받아 작성한 글이며, 디지털 트렌스포메이션의 변화를 위해 페리(pperi)는 동참 할것입니다.

도움이 필요 하시다면 언제든지 연락 주시기 바랍니다.

저희 pperi는 peri가 아닌점을 구독자님이 인지 하여주시기 바랍니다.

https://www.pperi.com