맥북 실리콘에서 LLAMA2 로컬에서 돌리는 방법입니다.

Deep Learning/NLP

맥북 실리콘에서 LLAMA2 로컬에서 돌리는 방법입니다.

jinmc 2023. 7. 24. 13:57

reference : https://www.youtube.com/watch?v=TsVZJbnnaSs

Repos and models
1. Request access: https://ai.meta.com/resources/models-and-libraries/llama-downloads/
2. Clone: https://github.com/facebookresearch/llama
3. Clone: https://github.com/ggerganov/llama.cpp

위 두 개의 git repository를 클론하고 1번 url에서 llama2 model을 받습니다.
llama2 모델은 (7B, 13B, 70B, 7B-chat, 13B-chat, 70B-chat) 6가지 종류 중 하나입니다.
7B 모델 기준 13GB정도 합니다.

lamma2 git repository 안에서 download.sh 파일을 실행시키면 1번 url에서 나온 request access url을 사용해서
llama2 model을 받을 수 있습니다.

다음은, lamma.cpp directory 안에서 다음을 실행합니다.

# 관련 library 설치
python3 -m pip install -r requirements.txt

# 16 비트 bin file로 변환 (주의 models/7B directory 만들어주기)
python3 convert.py --outfile models/7B/ggml-model-f16.bin --outtype f16 ../../llama2/meta_models/llama-2-7b-chat

# llama.cpp make
make

# 16Bit file을 4Bit file로 quantize
./quantize ./models/7B/ggml-model-f16.bin ./models/7B/ggml-model-q4_0.bin q4_0

# 실행
./main -m ./models/7B/ggml-model-q4_0.bin -n 1024 --repeat_penalty 1.0 --color -i -r "User:" -f ./prompts/chat-with-bob.txt

'Deep Learning > NLP' 카테고리의 다른 글

RAG란? 그리고 Langchain 을 이용한 구현까지 (0)	2024.01.23
Jetson 에서 LLAMA2 돌리기! (0)	2023.07.28
LLAMA2. 과연 엄청난 혁신일까? (0)	2023.07.24
로컬에서 LLM을 돌려봅시다.. (2) 장비를 맞춰봅시다 (1)	2023.06.01
로컬에서 LLM을 돌려봅시다.. (1) LAMMA 그리고 그 이후 (0)	2023.05.17

현재글맥북 실리콘에서 LLAMA2 로컬에서 돌리는 방법입니다.

Today :
Yesterday :

개발여행 가 봅시다~

tensorflow, Linux, CNN, Git, mac, GCP, ubuntu, cv2, spring boot, TFlite, OpenCV, yolov5, image classification, docker, Android, jetson, yolo, 도커, tx2, Python,

일	월	화	수	목	금	토
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

걸어서개발한바퀴