IT/AI 4

[chatgpt] 커스텀 GPT 만들어보기

2023년 11월 6일 OpenAI Devday에서 공개되었죠. GPTs 바로 커스텀 GPT입니다. 개인이 목적에 맞게 GPT를 커스텀해서 만든 챗GPT를 의미합니다. 만들어진 커스텀 GPT를 스토어에도 등록할 수 있다고 하고 비공개로도 사용할 수 있습니다. 아직 GPT 3.5에서는 사용이 불가능하고 GPT plus 를 구독하는 사용자에 공개되었습니다. 저도 한번 사용해보려고 하는데요. 청조봇을 만들까하다가 (I am chatbot...) 조금 유행이 지난듯 하여 제 말투와 제 성향을 학습한 GPTs로 남편 혹은 친구들과 카톡에서 대화를 해보겠습니다. 1. Create a GPT우선 chat.openai.com으로 접속해서 Create a GPT 를 클릭해봅니다. 2. 커스텀 GPT 생성하기Message..

IT/AI 2023.11.14

[AI] Vector database chroma 사용해보기

벡터 데이터베이스는 비정형 데이터를 벡터 (크기와 방향으로 정의되는 수치) 형태로 저장하고 쿼리하는데 특화된 DB입니다. 대표적으로 언급되는 DB가 Pinecone, Zillis, Chroma, Weaviate 등이 있습니다. 일반적으로 DB라 하면 Oracle, Postgresql 과 같은 관계형 데이터베이스나 mongo DB와 같은 NoSQL 정도를 떠올릴 수 있는데요. AI 시장에서는 데이터를 효율적으로 저장하고 소비하기 위해 벡터 데이터베이스가 자주 활용됩니다. LLM 자체가 입력받은 정보를 매번 저장하는게 아니다보니 이 저장의 영역을 보완하는게 벡터 데이터베이스라고 볼 수 있을 것 같습니다. 1. 벡터 임베딩이란? 방금 말한 벡터 임베딩은 데이터에 대응하는 벡터를 만들어서 결국 기계가 이해할 수..

IT/AI 2023.10.31

[python] embedchain을 사용하여 유튜브 내용 분석하기

문득 학교다닐 때가 떠오릅니다. 교수님들은 항상 텍스트를 주시면서 혹은 웹사이트나 책을 알려주시면서 여기에 있는 내용을 요약하거나 서평을 쓰라고 하셨죠. 구글링으로 대충 내용 요약본만 보고 구구절절 헛소리를 쓰다보면 결론은 재수강이었습니다. 그 때 embedchain이 있었다면 좀더 상황이 나았을라나요? embedchain을 활용해보자. embedchain은 LLM을 위한 프레임워크 입니다. 데이터셋 예를 들면 Youtube video, PDF file, Web page 등을 통해 질의를 날릴 수 있구요. 이걸 기반으로 나만의 chatbot app도 개발할 수 있는 아주 유용한 프레임워크라고 볼 수 있습니다. https://github.com/embedchain/embedchain GitHub - emb..

IT/AI 2023.10.20

[chatgpt] chatgpt에 web 스크래핑 코드 생성요청 하기

chatgpt에 python 코드를 짜달라고 하는 것은 아주 간단한 일입니다. 물론 얼마나 정확하게 요구사항을 전달하느냐는 좀 다른 문제긴하죠. 앞서 python 으로 네이버 증권에 특정 주식 일별 시세를 받아오는 코드를 짜봤는데요. https://gniogolb.tistory.com/13 [python] 네이버 증권 web crawling 해보기 오늘도 잡주에 물려있는 고잉킴입니다. 테마주 크리 타고 잠깐 올랐던 주식에 물려서 빼지도 못하고 외면하고 있습니다. 헛헛한 마음에 이미 많은 블로그에서 공유되었지만 일별 시세를 web crawl gniogolb.tistory.com 이걸 chatgpt는 어떻게 짰는지 한번 공유해드리겠습니다. 참고 : https://oxylabs.io/blog/chatgpt-w..

IT/AI 2023.10.19