| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | |
| 7 | 8 | 9 | 10 | 11 | 12 | 13 |
| 14 | 15 | 16 | 17 | 18 | 19 | 20 |
| 21 | 22 | 23 | 24 | 25 | 26 | 27 |
| 28 | 29 | 30 | 31 |
- python
- Algorithm
- CI/CD
- javascript
- 알고리즘
- React
- AI
- Flask
- build
- queue
- Two Pointer
- modbus
- 파이썬
- monorepo
- docker
- typescript
- turbo
- BFS
- RDP
- 프로그래머스
- LLM
- Infra
- rag
- jenkins
- VectoreStore
- dfs
- javascirpt
- ansible
- frontend
- DP
- Today
- Total
목록rag (4)
DM Log
서론PDF Q&A 서비스의 백엔드 핵심 구조를 구현LangChain을 이용해 RAG(Retrieval-Augmented Generation) 을 구성하고, IDE용 MCP 서버와 웹용 FastAPI 서버 두 가지 형태로 동시에 제공즉, IDE(CURSOR, Claude 등)에서도, React 프론트엔드에서도 동일한 모델과 벡터스토어를 사용하는 통합 AI 백엔드 구조 설계벡엔드 디렉토리 구조backend/└── pdf_server/ ├── mcp_server.py # MCP 프로토콜 서버 (IDE용) ├── api_server.py # FastAPI REST 서버 (웹용) └── app.py # 두 서버 동시 실행 (thre..
다중 PDF에서 답변 받기 여러 PDF를 동시에 다루는 RAG 구조를 생성, 질문과 관련 잇는 파일을 우선순위로 정하여 답변하는 방법 실[구현 전략]1. 여러 PDF를 로딩 → 분할 → 임베딩 → Chroma에 저장2. 각 문서에 source 메타데이터(파일명)을 붙임3. 사용자 질문 → 관련 문서 검색 → 파일별 점수 집계4. 관련성 높은 파일 우선순위 반환5. 선택된 파일만을 기반으로 QA 실행다중 PDF RAG 서버 구축[코드 예시]1. 여러 PDF 로드 및 벡터 스토어 생성import osfrom langchain_community.vectorstores import Chromafrom langchain_community.document_loaders import PyPDFLoaderfrom l..
PDF 문서에서 답변 받기 PDF 문서를 기반으로 질문에 답변하는 RAG 서버 구축사내 문서 / 연구 자료 / 메뉴얼 같은 PDF 파일을 AI 질의 응답 시스템에 활용 가능환경 준비1. 필수 라이브러리 설치pip install langchain langchain-community langchain-openai chromadb pypdf mcp 2. OpeanAI API Key 설정export OPENAI_API_KEY="your_api_key_here" # macOS/Linuxsetx OPENAI_API_KEY "your_api_key_here" # Windows PowerShell 또는 코드 상단에import osos.environ["OPENAI_API_KEY"] = "your_api_key..
GPT의 한계 보완하는 방법GPT 같은 LLM은 놀라운 언어 능력을 가지고 있음, 하지만 치명적인 한계 존재최신 정보에 대한 업데이트 (학습 데이터 시점 제한)문서 전체를 한 번에 처리가 어려움 (컨텍스트 윈도우 제한)잘못된 정보 (환각, hallucinataion)를 생성하기도 함👉 한계를 극복하기 위해 등장한 방식이 검색 증강 생성 (RAG, Retrieval-Augmented Generation)RAG란?[RAG]Retrieval(검색) + Generation(생성)질문을 임베딩으로 변환벡터 DB에서 관련 문서 검색검색 문서를 프롬프트에 삽입LLM이 문서 기반 답변 생성RAG는 외부 지식 검색 결과를 LLM 입력에 주입하여 신뢰성 있는 답변을 생성하는 구조[기본 구조]사용자 질문 → [임베딩 변환..