기본 콘텐츠로 건너뛰기

[2023-03-29] LLaMa on MacBook Pro 2019 (Ventura 13.3, Intel, 8core, 32G M, 512 GB SSD)

[2023-03-29] LLaMa on MacBook Pro 2019 <Intel, 8core, 32G M, 512 GB SSD) 


안녕하세요. 클스 입니다. 

얼마전 facebook에서 인류의 발전을 가속화하기 위해 경량 모델인 LLaMa를 공개했습니다.

맥북 프로 M1, M2에서 64GB 환경에서 구동하는 동영상은 많습니다. 그런데 제가 갖고 있는건 

Intel 2019년 모델입니다 그래도 한번 돌려보고 싶어서...

ChatGPT에 버금가는 성능이라하여.. 궁금하기도 합니다.


1) github에서 소스 다운로드

https://github.com/facebookresearch/llama

https://github.com/antimatter15/alpaca.cpp/releases  ==> 여기서 다운할거에요


alpaca-mac.zip 을 다운로드 받을거에요~ alpaca-mac.zip 인데 이름을 바꿔서 버전을 붙혀줬습니다.

압축을 푸니 chat_mac 실행파일 하나만 나오네요~


실행해보았습니다. 필요한 모델들이 있습니다. huggingface 에서 다운받도록 하겠습니다.

(py3.11.2) [~/Downloads]$ ./chat_mac
main: seed = 1680065783
llama_model_load: loading model from 'ggml-alpaca-7b-q4.bin' - please wait ...
llama_model_load: failed to open 'ggml-alpaca-7b-q4.bin'
main: failed to load model from 'ggml-alpaca-7b-q4.bin'
(py3.11.2) [~/Downloads]$


2) huggingface에서 모델 다운 받기

구글에서 검색해보면 결과가 엄청 많이 나옵니다. 많은 사람들이 연구를 하고 결과를 오픈하고 있습니다.

난 어떤걸 받아야 하지? 


https://huggingface.co/Sosaka/Alpaca-native-4bit-ggml 이걸 받습니다. 

This is a https://huggingface.co/chavinlo/alpaca-native converted in GGML (alpaca.cpp) format and quantized to 4 bits to run on CPU with 5GB of RAM.

이정도 사양에서 돌아간다고 하네요~  Alpaca-native-4bit-ggml/ggml-alpaca-7b-q4.bin 파일이 약 4.21GB 입니다. 



alpaca 디렉토리를 생성합니다. 그리고 2개의 파일을 복사합니다.


드디어 대망의 실행 순간이 왔습니다.


아주 부드럽고 5초 정도 안 걸려서 프롬프트가 떴습니다 14:13분에 실행 Explain facebook alpaca 를 입력하고 엔터 ... 한참을 망설이다가.... 뚜벅뚜벅 답을 주기 시작합니다. 1분 정도 걸리는 것 같네요~ 제 mac의 사양을 감안하고 .. GPU 없어요~~ CPU는 평소 10% 이내를 사용하는 데... 지금 50.5% 사용중이네요~ 14:17분에 답을 내놨습니다.




앞으로는 alpaca를 이용해 회사 내부 데이터 학습해서 chatGPT같은 서비스가 많이 나올거라 예상됩니다.

Mac Studio Ultra가 있으니 그걸로 한번 돌려보고 싶네요~

다낭 여행한번 가보려고, 물어봤더니.. 뭔 소리여~~ 언능 한국어 학습된 모델이 나오면 좋겠습니다.
어딘가에 있을것 같네요~ 


답변을 구글 번역에서 돌려보니 다음과 같다네요~

>  Explain facebook alpaca
Facebook Alpaca was created to help people connect with each other more easily and efficiently on Facebook by using artificial intelligence (AI). It is designed to understand user intent, recognize patterns in conversations, and generate natural language responses. By leveraging AI technology, it can provide users a faster way of finding information or connecting with friends without having to type out long queries.

> 다낭은 어느나라에 있어?
Dalian is located in Northeast China's Liaoning Province, bordering the Yellow and Bohai Seas. It has a temperate monsoon climate with four distinct seasons - spring, summer, autumn and winter. The average annual temperature of Dalian City is 8.5 degrees Celsius (47.3°F).

대련은 중국 동북부 랴오닝성에 위치하며 황해와 발해를 접하고 있습니다. 봄, 여름, 가을, 겨울의 사계절이 뚜렷한 온대 계절풍 기후입니다. 대련시의 연평균 기온은 섭씨 8.5도(47.3°F)입니다.

> DanWhere is Danang ?
Danang is a coastal city in central Vietnam located on the eastern side of the Panhandle region, near the demilitarized zone that separates North and South Korea. It has an estimated population of 519,286 people as of 20

그래도 영어는 대답을 잘하네요~


alpaca 한국어 학습시켜서 봇을 만는 분이 계시네요~

https://huggingface.co/beomi/KoAlpaca-Polyglot
https://github.com/Beomi/KoAlpaca




감사합니다.







댓글

이 블로그의 인기 게시물

[quaser.dev][2014-09-14] 윈도우즈(10, 64bit)에 개발환경 설정하기

[quaser.dev][2014-09-14] 윈도우즈(10, 64bit)에 개발환경 설정하기

[2024-10-19] iPhone, iPad에서 ChatGPT로 PDF 생성시 한글 깨짐 해결 방법

iPhone, iPad에서 ChatGPT로 PDF 생성 시 한글 깨짐 해결 방법

[2025-04-16(수)] OpenAI gpt-4.1 시리즈 발표, Anthropic Claude에 대한 생각

OpenAI gpt-4.1 시리즈 발표, Anthropic Claude에 대한 생각 안녕하세요. 클스 입니다. 4/15일자로 openai가 gpt-4.1 시리즈를 발표 했습니다. 현재는 api로만 사용가능합니다. 점차 웹/앱 사용자에게 오픈 될거라 생각 됩니다. 비용상 문제로 4.1-mini, nano를 사용해서 chatbot을 만들어 보고 있습니다. 4o 시리즈 보다는 확실히 빠르고, 답변의 정확도는 올라간 것 같습니다. 앤트로픽 클로드와 비교를 많이 하는데, 업무 시스템 혹은 AI 솔루션을 개발하는 입장에서는 어떤 생태계를 제공하는가가 주요한 결정 입니다. AI관련 인력을 충분히 보유한 회사의 경우는 어떤걸 사용해도 좋을 결과를 가지겠지만 일반적인 챗봇 개발 절차를 보면 다음과 같이 볼 수 있습니다. 1. 문서를 준비한다. 대부분 pdf, text, markdown 2. 문서를 파싱해서 vectordb에 올린다.     - 별도 벡터디비 구성 필요. 어떤 db를 선택할지 고민 필요     - 어떤 Parser를 사용할지, 텍스트 오버래핑은 얼마가 적당한지 고민 필요        (회사의 문서가 워낙 많고, 다양하면 하나하나 테스트 해서 좋은걸 선택하는 것이 어렵다)     - 유사도 측정은 어떤 알고리즘을 써야할지 고민 필요     - llamaindex도 고민해야 함. 3. RAG flow를 만든다.     - langchain을 쓸지, 각 AI 벤더에서 제공하는 sdk를 쓸지 고민 필요       (대부분 락인이 되지 않으려면 langchain을 사용하면 좋지만, 벤더에 특화면 기능 적용이 늦음) 4. 챗봇 UI 앱을 만든다.     - 답변이 text 로 구성되다 보니. 그래프, 이미지등 복합적인 컨텐츠를 재배치 하여 표현하기 상당히 어렵네요. (이건 제가 실력이 모자라서 .. 패스) ...