일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- Algorithm
- 완전탐색
- dfs
- typescript
- heapq
- modbus
- Two Pointer
- queue
- 알고리즘
- React
- InfluxDB
- 프로그래머스
- javascript
- LLM
- 스택/큐
- rag
- DP
- BFS
- MCP
- VectoreStore
- 파이썬
- retriever
- OpenAI
- python
- AI
- chroma
- javascirpt
- 코딩테스트
- frontend
- backend
- Today
- Total
목록OpenAI (2)
DM Log
벡터DB를 활용한 문서 검색 실습Chroma를 이용해 문서를 벡터화하고, 검색하는 실습 진행Chroma는 설치가 간편하고 LangChain에서 기본적으로 지원하기 때문에, RAG 실습환경 세팅 1. 필수 라이브러리 설치pip install langchain langchain-community langchain-openai chromadb 2. OpenAI API Key 설정export OPENAI_API_KEY="your_api_key_here" # macOS/Linuxsetx OPENAI_API_KEY "your_api_key_here" # Windows PowerShell 또는 코드 상단import osos.environ["OPENAI_API_KEY"] = "your_api_key_her..
컴퓨터의 텍스트 이해 방식사람은 "사과"를 보면 과일을 떠올리고, "애플"을 보면 회사나 아이폰을 연상한다. 하지만 컴퓨터는 "사과"를 단순한 문자열로 인식한다.텍스트 의미적 관계를 이해하기 위해서는 텍스트를 수학적 공간의 좌표 즉, 벡터 공간의 좌표로 변환이 필요하며, 이를 임베딩이라고 한다.임베딩은 RAG, 추천 시스템, 검색 엔진, 챗봇 등 AI 서비스의 기반이 되는 핵심 개념이다.백터 표현의 필요성텍스트는 문자나 단어 나열 (그대로 비교 불가능)단순한 방법: 원-핫 인코딩(one-hot encoding)사과: [1,0,0,0,...]바나나: [0,1,0,0,...]한계:차원이 단어 수만큼 커짐사과와 배의 의미적 유사성을 표현 불가추후, 단어 / 문장을 저차원 벡터 공간에 배치해 의미적 거리로 비교..