전체 글 176

ChatGPT 로 쓴 data split script (Image classification)

ChatGPT로 다음과 Image classification 관련해서 train, val, test 관련된 python script 를 써달라고 말해 봤습니다. 다음은 말한 ChatGPT Script 입니다. 더보기 write me a script in python that splits images into train/val/test. The source will have several directories with images in it. Target will be empty at first. the Target will output three directories, which will maintain the directory structure as the source directory. We shou..

원격으로 Jupyter notebook 사용하기

안녕하세요 오늘은 원격으로 Jupyter notebook에 접속하는 방법에 대해서 알아보도록 하겠습니다. 먼저 전제조건이 필요한데, 포트포워딩 등을 통해서 ssh 를 접속 할 수 있는 것을 기본조건으로 하겠습니다. ssh walkaroundthedevelop@10.22.33.444 로 접근할 수 있다는 걸 전제조건으로 합니다. 하지만 vim으로 작업하는건 너무 힘듭니다. 로컬이 아니라서 딜레이도 있을 거구요. 일단 연결하려는 곳에서 jupyter notebook 을 실행합니다. jupyter notebook --allow-root --ip 0.0.0.0 그 이후 연결하고자 하는 곳에서 브라우저에 다음과 같이 치면 됩니다. http://10.22.33.444:8888/ 이후 password 및 token을..

Network 2023.09.07

tf 에서 confusion matrix에서 actual value와 prediction value가 다른 경우

이미지 분류 모델을 test 하는데 있어서, test script를 짤 일이 있었습니다. confusion matrix를 만드는데, actual value와 prediction value을 다르게 만들고 싶어서 찾아봤습니다. 위의 경우와 같이 predicted value와 actual value가 같은 경우도 당연히 있고, 결국 맞출 수 있을것으로도 생각되지만, 어떤 경우에는 actual value 와 predicted value가 다른 경우도 있을 것입니다. 이에 대해서 한번 보았습니다. 일단 같을 때의 코드를 봅시다. import numpy as np import tensorflow as tf import pandas as pd def create_confusion_matrix(y_true, y_pr..

Machine Learning 2023.08.18

Classification 에서의 ROC curve 와 AUC의 관계

https://walkaroundthedevelop.tistory.com/80 Precision과 Recall, 그리고 f1 score 참고 : https://jinmc.github.io/ds_blog/posts/ml_andrew_ng/wk6/ 오늘은 Precision과 Recall, mAP에 대해서 정리해보도록 하겠습니다. 예를 들어서, 100명의 사람과 10명의 암환자가 있다고 생각해 봅시다. 암환자 입장 walkaroundthedevelop.tistory.com 기초 개념은 위의 포스팅에서 썼던 precision과 Recall의 관계에 있습니다. FPR(False Positive Rate)을 사용합니다. 우리가 사용했던 Precision의 경우 False Positive와 True positive를..

Data Science 2023.08.01

Jetson 에서 LLAMA2 돌리기!

결론부터 말하면, 돌리기는 실패했습니다. 하지만 llama.cpp를 make하는데까지는 성공하고, 또 어떤 노력으로 돌리려고 했는지의 과정을 설명하려고 합니다. 사용 device : Nvidia Jetson Xavier NX Developer cat /proc/device-tree/model 그 전에 llama2를 로컬에서 돌리는 방법의 포스팅을 참고해서, https://walkaroundthedevelop.tistory.com/166 맥북 실리콘에서 LLAMA2 로컬에서 돌리는 방법입니다. reference : https://www.youtube.com/watch?v=TsVZJbnnaSs Repos and models 1. Request access: https://ai.meta.com/resource..

Deep Learning/NLP 2023.07.28

LLAMA2. 과연 엄청난 혁신일까?

LLAMA 모델이 공개(또는 유출?) 되면서 한번 파란이 일었었는데, 생각보단..? 별로 우리의 삶에 영향이 없었던 것으로 생각됩니다.그 이유로는, 아마 훨씬 더 좋은 모델인 GPT3, GPT3.5, GPT4 가 무료 또는 적은 비용으로 사용이 가능하기 때문이라고 생각됩니다. 게다가, LLAMA 초기 모델의 경우 모델을 구하는것도 상당히 어려웠어서, 더 개발하기가 힘든 부분이 있었습니다. 하지만 이번 LLAMA2 같은 경우, 메타에서 작정하고 내놓은 느낌입니다. 그럼 LLAMA 1에 비해서 어떤 점이 달라졌는지 살펴볼까요?? context size가 커진 것, 훈련에 사용된 데이터가 40% 늘어난 점, 상업적 사용이 가능한 점 이외에, 가장 중요한 점은, Fine-tune할 수 있는 Chat versio..

Deep Learning/NLP 2023.07.24

맥북 실리콘에서 LLAMA2 로컬에서 돌리는 방법입니다.

reference : https://www.youtube.com/watch?v=TsVZJbnnaSs Repos and models 1. Request access: https://ai.meta.com/resources/models-and-libraries/llama-downloads/ 2. Clone: https://github.com/facebookresearch/llama 3. Clone: https://github.com/ggerganov/llama.cpp 위 두 개의 git repository를 클론하고 1번 url에서 llama2 model을 받습니다. llama2 모델은 (7B, 13B, 70B, 7B-chat, 13B-chat, 70B-chat) 6가지 종류 중 하나입니다. 7B 모델 기준 ..

Deep Learning/NLP 2023.07.24

딥러닝ai ChatGPT Prompt Engineering for Developers 정리와 리뷰

딥러닝ai 에 있는 ChatGPT Prompt engineering for developers 강의를 들은 정리와 소감 내용입니다. 강의는 deeplearning.ai 에 있으며, https://github.com/jinmc/chatGPT-Prompt-Engineering-for-Developers 에 관련 노트북 코드도 올려 놓았습니다. 1. Guidelines delimeter 사용하기 (특히 input에 관해서), json, html 등의 포맷으로 리턴하기, 스텝을 거쳐서 모든 조건이 완료되었는지 확인, Few-shot prompting (대화에 맞춰서 response output 하기), 몇 단계를 나눠서 response를 output하기, 등등 2. Iterative prompt developm..

openai 2023.07.21

ChatGPT Finetuning 정리 (7/4)

ChatGPT의 시대가 열리면서, ChatGPT 를 어떻게 활용해야 되는지에 대해서 온갖 방법들이 생깁니다. ChatGPT 그 자체로도 훌륭하지만, 좀 더 Customize 하고 싶은 사람들이 많아지면서 Finetuning에 대한 방법이 나옵니다. Finetuning을 하는 이유에 대해서 먼저 정리해 보자면, Fine-tuning lets you get more out of the models available through the API by providing: Higher quality results than prompt design Ability to train on more examples than can fit in a prompt Token savings due to shorter prompt..

openai 2023.07.05

No toolchains found in the NDK toolchains folder for ABI with prefix: arm-linux-androideabi ndk 관련 문제 해결

안드로이드에서 다음과 같은 에러가 나왔습니다. No toolchains found in the NDK toolchains folder for ABI with prefix: arm-linux-androideabi 여러가지를 시도해봤지만, 결국 통한 것은, android studio 에서 tools->SDK Manager->Android SDK -> SDK Tools 에 들어가면 있습니다. 원래 여러 개의 ndk 가 설치 되어있었는데 다 클릭 해제 하고 하나만 클릭해서 설치했더니 되었습니다. 시도했던 것들: cache invalidate, ndk-build install-toolchain, gradle 에다가 경로저장, 등등이 있습니다. 참고자료 : https://github.com/flutter/flutt..