걸어서개발한바퀴

  • 홈
  • 태그
  • 방명록

2025/04/28 1

🔥 BM25란 무엇인가? (TF-IDF와의 비교 및 이후 발전)

1. 왜 TF-IDF만으로는 부족할까?검색 시스템이나 정보 검색(IR) 분야에서는 문서 내 특정 단어가 얼마나 중요한지를 판단해야 합니다.가장 널리 알려진 기법이 바로 TF-IDF입니다.하지만 TF-IDF만으로는 한계가 있습니다:단어가 너무 자주 등장하면 점수가 비정상적으로 커지는 문제문서 길이를 고려하지 않아서, 긴 문서가 무조건 유리해지는 문제이러한 문제를 해결하기 위해 등장한 것이 바로 BM25입니다. 2. TF-IDF란? (개념과 수식)✅ Term Frequency (TF)한 문서에서 특정 단어가 얼마나 자주 등장하는지를 나타냅니다.TF(t, d) = (문서 d에서 단어 t가 등장한 횟수) ÷ (문서 d의 전체 단어 수)✅ Inverse Document Frequency (IDF)전체 문서 중 해..

Deep Learning/NLP 2025.04.28
1
더보기

방문자수Total

  • Today :
  • Yesterday :
프로필사진

개발여행 가 봅시다~

  • 분류 전체보기 (193)
    • Audio Processing (2)
    • 알고리즘 (7)
      • 리트코드 (5)
    • Data Engineering (3)
    • Linux (16)
      • Ubuntu (13)
    • Utils (15)
      • Program (4)
      • Git (6)
    • Machine Learning (30)
      • Device (7)
      • Tensorflow (5)
      • Regression (1)
    • Python (10)
      • Concurrency (4)
      • Basics (3)
    • 환경설정 (11)
    • kaggle 및 dacon (2)
    • Web Programming (18)
      • Server (5)
      • Java Spring (11)
    • Cloud (2)
      • Docker (7)
    • Network (2)
      • protocols (1)
    • Video Processing (5)
      • Gstreamer (2)
    • Image Processing (11)
      • Cv2 (8)
    • Deep Learning (30)
      • NLP (10)
      • Computer Vision (11)
    • 잡담 (2)
    • 모바일 (1)
      • 안드로이드 (10)
      • flutter (2)
    • openai (5)
    • Data Science (2)

Tag

Linux, yolov5, image classification, 도커, ubuntu, TFlite, Python, Git, Android, yolo, tensorflow, docker, spring boot, tx2, CNN, jetson, mac, GCP, cv2, OpenCV,

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2025/04   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30

Copyright © Kakao Corp. All rights reserved.

티스토리툴바