1. CJK Width Token Filter(CJK宽度过滤器)

原文链接 :https://www.elastic.co/guide/en/elasticsearch/reference/5.4/analysis-cjk-width-tokenfilter.html

译文链接 : http://www.apache.wiki/pages/viewpage.action?pageId=10028056

贡献者 : 李亚运ApacheCNApache中文网

1.1. 简述

cjk_width令牌过滤器归一化CJK宽度差异:

  • 将全宽ASCII变体折叠成等效的基本拉丁语
  • 将片假片变体的半角折叠成相当的假名

该令牌过滤器可以被视为NFKC / NFKD Unicode归一化的子集。 有关完整的规范化支持,请参阅analysis-icu插件

Copyright © Kilvn 2021. all right reserved,powered by Gitbook最后更新时间: 2021-06-08 20:22:42

results matching ""

    No results matching ""