'rag' 태그의 글 목록

rag 3

aws Lex, Lambda, Bedrock을 이용해서 RAG chatbot 만들기(1. Lambda code)

aws에서 제공한 lex, lambda, bedrock을 이용한 RAG chatbot 만들기 중 Lambda 코드에 대해서 포스팅을 하려고 합니다. 시작에 앞서서 각각의 서비스들을 설명해 보자면, 1. AWS Lex챗봇 서비스: 사용자의 입력(텍스트/음성)을 이해하고 대화를 관리합니다.구성 요소:Intent: 사용자의 의도를 정의. 예) 병원 찾기.Slots: 추가로 입력받아야 할 정보. 예) 병원 이름, 위치.2. AWS Lambda서버리스 함수: Lex가 요청한 작업(데이터 처리, 외부 API 호출 등)을 처리합니다.특징:Lex에서 받은 데이터를 처리하고, Bedrock이나 DB와 연동.3. AWS Bedrock생성형 AI 서비스: AI 모델(GPT, Claude 등)을 사용해 자연어 답변 생성.K..

Cloud 2025.01.21

RAG의 새로운 대안 .. RAFT(RAG 할바에야 RAFT!)

요즘 RAG(Retrieval Augmented Generation)를 모르는 사람이 없을 정도로 RAG가 대세로 떠오르고 있습니다. RAG를 모르는 사람들을 위해서 간단하게 설명하자면, RAG란, Base Document가 있고, 거기를 참고해서 Q&A를 하게 만드는 것을 말합니다. Prompt Engineering 을 어떻게 하느냐에 따라 물론 달라지겠지만, Hallucination을 방지하기 위해서 많이 씁니다. 하지만 단점으로는, Base model의 성능에 너무 많은 의존을 하게 되고, 그러다 보니 Foundation 모델의 성능이 떨어지게 되면 성능의 퀄리티가 떨어지는 단점이 있습니다. Foundation model 의 성능에 의존하다 보니, 가장 좋은 모델 (가령, GPT 4)를 쓸 수 밖에..

Deep Learning/NLP 2024.07.16

RAG란? 그리고 Langchain 을 이용한 구현까지

RAG란, Retrieval-Augmented Generation의 약자로, retriever(검색기) 파트와 generator(생성기) 파트로 나눠져 있습니다. retriever는 관련 정보를 Database에서 검색하고, 생성기는 이 정보를 사용하여서 최종 응답을 생성합니다. 관련 링크 : https://python.langchain.com/docs/use_cases/question_answering/ Q&A with RAG | 🦜️🔗 Langchain Overview python.langchain.com Indexing 이후에, (load -> split -> store)이후에, Vector Database 또는 Embedding model 에 저장한 후에, Retrieval 과 Generation..

Deep Learning/NLP 2024.01.23

Today :
Yesterday :

개발여행 가 봅시다~

OpenCV, Git, jetson, mac, GCP, CNN, tx2, cv2, yolov5, yolo, tensorflow, spring boot, Python, 도커, Linux, ubuntu, image classification, TFlite, docker, Android,

일	월	화	수	목	금	토
				1	2	3
4	5	6	7	8	9	10
11	12	13	14	15	16	17
18	19	20	21	22	23	24
25	26	27	28	29	30	31

걸어서개발한바퀴

rag 3

티스토리툴바