Skip to content

Conversation

ahnjj
Copy link

@ahnjj ahnjj commented Sep 29, 2025

What does this PR do?

This PR adds a new notebook titled:

한국어 제목 : "벡터 검색 에이전트: 허깅페이스 허브를 백엔드로 하는 똑똑한 검색 엔진"
영어 제목(미번역상태-가제) : "Vector Search Engine Agent : Smart Search Engine with HuggingFace Hub as backend"
to the Open-Source AI Cookbook.

What's Inside

This notebook demonstrates a tutorial for building a search engine agent using smolagents library

Checklist

  • Notebook executes top-to-bottom without errors
  • Notebook added at notebooks/ko/vector_search_agent.ipynb
  • Entry added to _toctree.yml
  • Entry appended to index.md under

Who can review?

Let me know if you'd like any changes or additions!
@4N3MONE, @Kim-Ju-won, @FacerAin, @ssum21, @TaskerJang, @HyunZ118

한국어 리뷰 완료후 메인테이너 리뷰 요청 예정입니다.

Copy link

Check out this pull request on  ReviewNB

See visual diffs & provide feedback on Jupyter Notebooks.


Powered by ReviewNB

@@ -0,0 +1,1586 @@
{
Copy link

@FacerAin FacerAin Sep 29, 2025

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

조금 더 자연스러운 표현이 될 수 있어 제안 드립니다 😊

얻을 수 있을 것 같습니다! -> 얻을 수 있습니다.


Reply via ReviewNB

@@ -0,0 +1,1586 @@
{
Copy link

@FacerAin FacerAin Sep 29, 2025

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

더 자연스러운 문장이 될 수 있도록 제안 드립니다!

위는 간단한 에이전트 시스템이지만, 품질 평가, 분석 등을 추가한다면 진정한 Agentic 검색 엔진을 구현할 수 있을 것 입니다!

->

지금까지 간단한 에이전트 시스템을 만들어보았습니다. 여기에 품질 평가, 분석 등을 추가한다면 진정한 Agentic 검색 엔진을 구현할 수 있습니다.


Reply via ReviewNB

@FacerAin
Copy link

Agentic 검색 관련해서 흥미롭고 유용한 Cookbook을 만들어주셔서 감사해요 😊
관련해서 간단한 리뷰를 남겼습니다 :) 감사합니다!

@TaskerJang
Copy link

TaskerJang commented Sep 30, 2025

전체적으로 잘 읽히는 문서네요 ㅎㅎ. 몇 군데 보면서 떠오른 것들 적어보아요!

제목 및 서론

Line 1

- 🤖 벡터 검색 에이전트: 허깅페이스 허브를 백엔드로 하는 똑똑한 검색 엔진
+ 🤖 벡터 검색 에이전트: 허깅페이스 허브 기반 지능형 검색 엔진

=> “똑똑한”은 다소 구어체 느낌이라, “지능형”으로 바꾸면 기술 문서 톤에 더 잘어울릴 거 같아요!!

그리고 그밖의 생각난 것들!!

서론

- 검색엔진은 크게 키워드 검색과 벡터 검색으로 분류 됩니다.
+ 검색 엔진은 크게 키워드 검색과 벡터 검색으로 나눌 수 있습니다.

- 키워드 검색과는 달리, 벡터 검색으로 진행할 경우 두가지를 고려해야합니다.
+ 키워드 검색과 달리, 벡터 검색을 사용할 때는 두 가지를 고려해야 합니다.

- 그러나, 임베딩값을 기반으로하는 벡터 검색만으로는 '사용자가 원하는 답변'를 보장하기 어렵습니다.
+ 하지만 임베딩 값을 기반으로 한 벡터 검색만으로는 ‘사용자가 원하는 답변’을 보장하기 어렵습니다.

- 따라서 검색의 각 단계에서 에이전트가 각 단계를 자율적으로 판단하고 최적화한다면 사용자가 원하는 답변에 가까운 검색 결과를 얻을 수 있을 것 같습니다!
+ 그래서 검색 과정에서 에이전트가 자율적으로 판단하고 최적화한다면, 사용자 의도에 더 가까운 검색 결과를 얻을 수 있습니다.

워크플로우 섹션

- 기존 벡터검색 워크플로우
+ 기존 벡터 검색 워크플로우

DuckDB 섹션

- 허깅페이스의 데이터셋은 파켓(parquet) 파일에 의존하는데 빠른 인메모리 데이터베이스 시스템인
+ 허깅페이스의 데이터셋은 파켓(parquet) 파일에 의존하는데, 빠른 인메모리 데이터베이스 시스템인

=> 쉼표 추가하면 좋지 않을까?! 하는 생각이!


섹션 제목들

- # 도구정의
+ # 도구 정의

- ### 도구1 : 임베딩 생성
+ ### 도구1: 임베딩 생성

- ### 도구2 : DuckDB인덱스 만들기
+ ### 도구2: DuckDB 인덱스 만들기

- ### 도구4 :답변 생성 도구
+ ### 도구4: 답변 생성 도구

Docstring

Args:
-   column_name: 임베딩할 컬럼 이름
+   column_name: 임베딩할 열 이름

=> “컬럼” 대신 “열”로 통일하는 것이 좋지 않을까요!


기타

- 무거운 벡터 검색 엔진을 배포할 필요가 없고 저장소는 허브에서 처리됩니다.
+ 무거운 벡터 검색 엔진을 따로 배포할 필요 없고, 저장소는 허브에서 처리됩니다.

수고 많으셨습니다! 안정님께서 활약해주신 덕분에 프로젝트가 더 잘되는거 같아요 ㅋㅋ

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants