科技

人物
互联网
IT
网络安全
网络通信

更多

大数据
云计算
无人机
机器人
智能家居
无人驾驶
机器学习
物联网
智能穿戴
智慧城市

首页 > 行业 > 自然语言

来源：互联网2020-03-09 07:57:52 热度：

怎样实现中文分词查询？

我们这里倒是有一套软件（主要是对商品上的），比如：娃哈哈牌苹果味全脂奶粉（500克），
先用这个软件拆开（首先把‘（）’和500克这个量词去掉）娃哈哈+牌+苹果+味+全脂+奶粉
由于汉语的特性，最后的名词才是关键，前面的都是用来修饰这个名词的，所以最后程序识别这个商品是奶粉。但是这个程序不是在数据库的方法作的，而是一个C++的程序，因为我们发现这样更快，如果用数据库的方法，反倒没有这个迅速。

过于模糊查询，前两天刚写了一点东西给别的组，大致的想法是通过模版，一次次来模，也是在商品的自动化分类上的应用，比如像上面的例子我先做一个商品的类别表作为模版，来第一次模，这样模后会有一些商品重复分类比如上面的例子那个奶粉同时被分在苹果和奶粉两种商品中，所以要对这种重复分类的商品继续取模，于是又作了一个模版，这个模版中判断
苹果和奶粉的优先级，奶粉的优先级〉苹果，这样第二次又分离出去一部分数据，然后第三次模，一般的我们经过测试三次基本上就没有什么数据不能分开了。剩下的少部分用肉眼就可以区分。不过用这个数据库的方法如果和上面第一种方法结合速度和质量上就会更上一层楼。

注：有些问题还是比较奇特的比如***牌西服套装，如果用最上面的方法，往往是把这个商品分成为套装，而实际上这个是没有意义的。

本文网址：

欢迎关注微信公众号：人工智能报；合作及投稿请联系：editor@cnaiplus.com

智能推荐

无相关信息

精选

AI中国号...

关注微信公众号，了解最新精彩内容

热门文章...

热门标签...

宇树科技创始人王兴兴提醒公众甄别不实信息

【环球网科技综合报道】3月2日消息，宇树科技创始人王兴兴近日以个人身份正式入驻微信视频号，并

2025-03-02
微软全球范围宕机数万人服务受影响

【环球网科技综合报道】3月2日消息，，据Downdetector数据显示，美国东部时间周六下午3点30分后，微

2025-03-02
埃隆·马斯克最新JRE 3小时访谈聊了啥·五万字完整版|谷歌|飞船|人工智能|外星文明|知名企业|埃隆_马斯克|spacex_订阅

2025-03-01
理想汽车2月交付量近2.7万辆，智能驾驶系统升级引市场热议！

[db:简介]

2025-03-01
岚图汽车2月销量破8千辆，同比增长152%，全年冲刺20万辆目标

[db:简介]

2025-03-01
特斯拉FSD入华引热议，车主：这位“老司机”有点不懂中国规矩

[db:简介]

2025-03-01
问界新M5 Ultra预订开启，23.8万起售

[db:简介]

2025-03-01
小鹏汽车2月交付量破3万，同比增长570%

[db:简介]

2025-03-01
DeepSeek 再次震惊全球：价格只有 OpenAI 1/25，利润率却超过 500%|gpu|计算量|大模型|openai|deepseek_订阅

2025-03-01
DeepSeek效应初现：Grok-3补刀ChatGPT，OpenAI已在ICU?|谷歌|微软|算法|预训练|知名企业|云计算费用|openai|deepseek_订阅

2025-03-01
刚刚，DeepSeek全面开源V3/R1推理系统！成本利润率高达545%|路由|冗余|通信|大模型|deepseek_订阅

2025-03-01
DeepSeek公布成本、收入和利润率！最高可日赚346万|冗余|计算量|大模型|deepseek_订阅

2025-03-01
2025西安丝绸之路国际旅游博览会

2025西安丝绸之路国际旅游博览会时间：2025年4月18-20日地点：西安国际会展中心

2025-03-01
2025江苏人形机器人展示洽谈会

2025江苏人形机器人展示洽谈会时间：3月25日-26日地点：南京国际博览中心

2025-03-01
GPT-4.5被DeepSeek 500倍吊打！基准测试全班垫底，OpenAI痛失护城河|gpt|安本正义|云计算费用|openai|埃隆_马斯克|deepseek_订阅

2025-03-01
5分钟顶人类8小时！OpenAI Deep Research订阅全推送，端到端强化微调是关键|智能体|isa|人工智能|deep|云计算费用|openai|research_订阅

2025-03-01
Nature独家爆料：全球机构撤稿率大排行，医学领域成重灾区|文章|学术论文_订阅

2025-03-01
Claude 3.7成精了！偷偷将OpenAI模型换成自己，卡帕西：好搞笑啊|算法|编辑器|openai|python|claude|高吞吐量内核_订阅

2025-03-01
2025机器人灵巧手创新大会暨灵巧手新技术新产品展示推广会

2025机器人灵巧手创新大会暨灵巧手新技术新产品展示推广会灵巧手作为机器人的核心部件是深

2025-03-01
IBM中国投资公司停运，1800员工一夜失业！昔日霸主黯然落幕|微软|大连|裁员|运营|ibm|知名企业_订阅

2025-03-01