fullfish

  • 홈
  • 글쓰기
  • 태그
  • 방명록

ngram 1

n-Gram 개선 및 고찰

자음 모음단위로 n-Gram 저번에 구현한 n-gram https://fullfish.tistory.com/109 n-Gram n-Gram이란 문장의 유사도를 비교하는 방법중 하나로 문장을 쪼개서 비교한다 예를 들어 3-gram으로 '과자중에 제일 맛있는건 새우깡' '제일 맛있는 과자는 무엇일까' 이 두문장을 비교한다면 각 문 fullfish.tistory.com 에서는 글자를 음절 단위로 잘라서 썼었다 예를 들어 안녕하세요를 3-Gram으로 한다면 ['안녕하', '녕하세', '하세요']로 나눴는데 활용하기 나름이지만 이번에는 자음 모음단위로 나뉘어 봤다 ['ㅇㅏㄴ', 'ㅏㄴㄴ', 'ㄴㄴㅕ' ...] 해당 방법의 장점은 오타나 어미가 달라도 검색이 될 가능성이 높아지게끔 허들을 낮출 수 있다 우선은 문자..

코딩 공부/검색 2022.05.15
1
더보기
프로필사진

  • 분류 전체보기 (314)
    • 코딩 테스트 (116)
      • 알고리즘 문제 푼거 모음 (1)
      • 알고리즘 공부 (23)
      • 프로그래머스 level1 (56)
      • 프로그래머스 level2 (32)
      • 프로그래머스 level3 (2)
      • 기타 (1)
    • 코딩 공부 (51)
      • 코드스테이츠 TIL (23)
      • 공부 (16)
      • 보안 (6)
      • 검색 (6)
    • 데이터 분석 (46)
      • python (5)
      • 데이터 수집 (6)
      • 데이터 시각화 (5)
      • 통계 (2)
      • 머신러닝, 딥러닝 (28)
    • nomadcoder (13)
      • Vanilla JS (4)
      • React JS로 영화 웹 서비스 만들기 (1)
      • React JS 마스터클래스 (6)
      • Typescript로 블록체인 만들기 (2)
    • Project (64)
      • mini-project (5)
      • codestates-first-project (9)
      • codestates-final-project (29)
      • arduino (8)
      • unity (3)
      • fullmemo (3)
      • multicampus-project (7)
    • RN (12)
    • 기타 (9)
      • 비공개 (1)
      • 기타 (8)

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

방문자수Total

  • Today :
  • Yesterday :

Copyright © Kakao Corp. All rights reserved.

글쓰기

티스토리툴바