Cognita – 사용자 정의 가능한 강력한 RAG 프레임워크

제목: Cognita – 사용자 정의 가능한 강력한 RAG 프레임워크
Cognita는 RAG 시스템을 구축하고 사용자 정의할 수 있는 강력하고 유연한 오픈소스 프레임워크입니다. 데이터 소스, 파서, 임베더, 벡터 DB, 재순위 모델 등 다양한 구성 요소를 모듈화하여 쉽게 확장하고 커스터마이징할 수 있습니다. 또한 직관적인 UI를 통해 데이터 소스 관리, 컬렉션 생성, 쿼리 입력 등의 작업을 간편하게 수행할 수 있어 개발자와 사용자 모두가 효과적으로 RAG 시스템을 활용할 수 있습니다.

Read More

Chroma DB 사용자 가이드 : Python

Chroma DB는 벡터 데이터베이스로, 임베딩을 관리하고 검색할 수 있는 기능을 제공합니다. 이 데이터베이스는 컬렉션을 생성, 검색, 업데이트, 삭제하는 기능과 메타데이터 및 문서 내용에 대한 필터링, 기본 인증 및 정적 API 토큰 인증과 같은 인증 옵션을 포함하여 다양한 방법으로 데이터를 쿼리하고 관리할 수 있습니다. 클라이언트와 서버 설정을 통해 인증을 구성하고, 서버 실행 및 클라이언트 연결을 쉽게 설정하여 Chroma DB의 기능을 활용할 수 있습니다.

Read More

생각의 뼈대(Skeleton-of-Thought): 새로운 프롬프트 엔지니어링 기법 탐색

생각의 뼈대(Skeleton-of-Thought, SoT)는 대화형 AI 응용 프로그램에서 질문에 대한 응답을 속도 높게 생성하기 위한 새로운 프롬프트 엔지니어링 방식입니다. SoT는 먼저 대답의 뼈대나 개요를 생성한 다음, 이 개요에 따라 자세한 내용을 병렬적으로 확장합니다. 이 방법은 특히 복잡하고 다양한 질문에 대한 응답을 구성할 때 시간을 절약할 수 있으며, 여러 테스트 케이스에서 효과적이라는 것이 연구에서 밝혀졌습니다.

Read More

ETL, ELT, 그리고 ELT+P: 데이터 처리 방식을 이해하고 선택하는 방법

데이터가 폭발적으로 증가하고 있는 현대 비즈니스 환경에서, 데이터를 효율적으로 처리하고 분석하기 위한 방법론은 필수적입니다. 데이터 통합과 분석을 위한 전통적인 방식인 ETL(Extract, Transform, Load)부터, 새로운 데이터 레이크 환경에 맞춘 ELT(Extract, Load, Transform), 그리고 최근에 주목받고 있는 ELT+P(Processing) 방식까지, 각 방식의 개념과 장단점을 살펴보겠습니다. 1. ETL(Extract, Transform, Load) 개념 ETL은 추출(Extract), 변환(Transform), **적재(Load)**의 세 단계로 구성된 데이터…

Read More

[논문]ReAct 프롬프팅: LLMs로부터 고품질 결과를 얻기 위한 프롬프팅 방법

ReAct Prompting: How We Prompt for High-Quality Results from LLMs | Chatbots & Summarization ReAct Prompting 프롬프트 엔지니어링은 대규모 언어 모델(LLMs)로부터의 결과의 품질과 정확성을 향상시키는 방법을 찾는 것에 관한 것입니다. 최근 몇 개월 동안, 생각의 연쇄(chain-of-thought) 프롬프팅과 같은 발전은 프롬프트 엔지니어가 그들의 결과의 품질을 향상시키는 데 도움을 주었습니다. 이 글에서는 우리의 목표 상태 출력에 도달하는…

Read More

LLM으로 텍스트를 가공하는 다양한 방법

이 글은 LLM이 다양한 포맷으로 입력을 변환하는 방법에 대해 설명하고 있습니다. 예를 들어, 한 언어로 작성된 텍스트를 다른 언어로 번역하거나 철자 및 문법 오류를 수정하는 작업을 말합니다. 이러한 기능은 채팅봇(ChatGPT)에서 일반적으로 사용됩니다. 또한 이 글은 번역 작업, 톤 변환, 다른 형식으로 변환, 철자 및 문법 검사 등에 대한 구체적인 예제를 제공합니다. 모든 이러한 예제는 언어…

Read More

위키피디아 웹 스크래핑: LLM 에이전트와 도구를 활용한 효율적인 정보 추출

LLM 에이전트, 도구, 함수 호출을 활용하여 위키피디아에서 노래 메타데이터를 추출하는 방법을 단계별로 살펴보았습니다. LangChain 프레임워크를 통해 GPT 3.5 Turbo 모델과 위키피디아 API를 연결하고, 사용자 정의 프롬프트와 출력 파서를 정의하여 원하는 정보를 구조화된 형식으로 추출할 수 있었습니다. 이 접근 방식은 유연성과 확장성이 높아 다양한 데이터 소스와 추출 태스크에 적용할 수 있는 강력한 도구이지만, LLM의 한계와 비용 등의 고려 사항도 존재합니다.

Read More

생성형 AI 관련 기사 및 자료

두 달 새 15%→65%…챗GPT 시대, 잘나가는 AI 회사 전략은? 세계 최대 벤처캐피털(VC) 중 하나인 세쿼이아 캐피털이 최근 흥미로운 보고서를 내놨습니다. 챗GPT 열풍이 분 이후 회사들이 거대언어모델(LLM)을 어떻게 쓰고 있는지에 대한 현황 보고입니다. 포트폴리오 회사 중 33곳을 대상으로 조사한 결과인데요. 불과 두 달 새 LLM을 적용한 앱을 만든 회사의 비중이 15%에서 65%로 급등했다고 합니다. 이창수 올거나이즈…

Read More