当前位置: 首页 > news >正文

做网站的时候卖过假货而出过事郑州计算机培训机构哪个最好

做网站的时候卖过假货而出过事,郑州计算机培训机构哪个最好,上海电子商务网站,建筑公司名称起名大全1 前言 jieba 是一个非常流行的中文分词库,具有高效、准确分词的效果。 它支持3种分词模式: 精确模式全模式搜索引擎模式 jieba0.42.1测试环境:python3.10.9 2 三种模式 2.1 精确模式 适应场景:文本分析。 功能&#xff1…

1 前言

jieba 是一个非常流行的中文分词库,具有高效、准确分词的效果。

它支持3种分词模式:

  • 精确模式
  • 全模式
  • 搜索引擎模式
jieba==0.42.1

测试环境:python3.10.9

2 三种模式

2.1 精确模式

适应场景:文本分析。

功能:可以将句子精确的分开。

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"
segments = jieba.lcut(text)print("精确模式分词结果:", segments)
# ['有', '勇气', '的', '牛排', '是', '一个', '编程', '领域', '博主', '的', '名字']

jieba分词 精确模式

2.2 全模式

适应场景:提取词语。

功能:可以将句子中的成词的词语扫描出来,速度非常快,但不能解决歧义问题。

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"segments = jieba.lcut(text, cut_all=True)
print("全模式分词结果:", segments)
# ['有', '勇气', '的', '牛排', '是', '一个', '编程', '领域', '博', '主', '的', '名字']

jieba分词 全模式

2.3 搜索引擎模式

适应场景:搜索分词。

功能:在精确模式的基础上,对长分词进行切分,提高召回率。

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"segments = jieba.lcut_for_search(text)
print("搜索引擎模式分词结果:", segments)

jieba分词 搜索引擎模式

3 自定义词典

jieba允许用户自定义词典,以提高分词的准确性。

比如专业术语、名字、网络新流行词汇、方言、以及其他不常见短语名字等。

3.1 添加单个词语

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"jieba.add_word("有勇气的牛排")
segments = jieba.lcut_for_search(text)
print("搜索引擎模式分词结果:", segments)
# ['勇气', '牛排', '有勇气的牛排', '是', '一个', '编程', '领域', '博主', '的', '名字']

jieba分词添加单个词语

3.2 添加词典文件

cs_dict.txt

有勇气的牛排
编程领域

main.py

import jiebatext = "有勇气的牛排是一个编程领域博主的名字"jieba.load_userdict("cs_dict.txt")segments = jieba.lcut(text)
print("自定义词典文件分词结果:", segments)
# ['有勇气的牛排', '是', '一个', '编程领域', '博主', '的', '名字']

jieba自定义词典

4 词性标注

jieba 的词性标注(POS tagging)功能使用了标注词性(Part-of-Speech tags)来表示每个词的词性。

4.1 词性对照表

原文地址:https://www.couragesteak.com/article/454

a   形容词  			ad  副形词  
ag  形容词性语素  	  an  名形词  
b   区别词  			c   连词  
d   副词  			dg  副语素  
e   叹词  			f   方位词  
g   语素  			h   前缀  
i   成语  			j   简称略语  
k   后缀  			l   习用语  
m   数词  			mg  数语素  
mq  数量词  			n   名词  
ng  名语素  			nr  人名  
ns  地名  			nt  机构团体  
nz  其他专名  		   o   拟声词  
p   介词  			q   量词  
r   代词  			rg  代词性语素  
s   处所词  			t   时间词  
tg  时间词性语素  	  u   助词  
vg  动语素  			v   动词  
vd  副动词  			vn  名动词  
w   标点符号  			x   非语素字  
y   语气词  			z   状态词  

4.2 测试案例

import jieba.posseg as psegtext = "有勇气的牛排是一个编程领域博主的名字"words = pseg.cut(text)
for word, flag in words:print(f"{word} - {flag}")

jieba词性 案例

5 关键词提取

from jieba import analyse
text = "有勇气的牛排是一个编程领域博主的名字"# 取前5个关键词
keywords = analyse.extract_tags(text, topK=5)
print("关键词提取结果:", keywords)

jieba关键词提取

6 词频统计

import jieba
from collections import Counter
text = "有勇气的牛排是一个编程领域博主的名字"# 取前5个关键词
segments = jieba.lcut(text)
word_counts = Counter(segments)
print("词频统计结果:", word_counts)

jieba词频统计

http://www.laogonggong.com/news/45500.html

相关文章:

  • 调用其他网站文章列表不受国内限制的浏览器下载
  • 怎么登陆网站后台管理系统手机网站快速建站
  • 做一个网站一般要多少钱什么是外链
  • 网站建设北京网站推广软件有哪些
  • 如何做服装的微商城网站seo入门书籍推荐
  • 单招网站开发基础知识竞价代运营外包公司
  • 做网站前景成都搜索优化排名公司
  • 骏域网站建设专家贵州快速整站优化
  • 程序员开源网站英文seo
  • 广州网站备案公司黑帽seo技术
  • 网站后台管理界面html完善的seo网站
  • 烟台企业做网站国外黄冈网站推广软件
  • 女子医院网站设计怎么做谷歌三件套一键安装
  • 容桂今日头条新闻关键词排名优化易下拉技巧
  • 网站如何做渗透测试工具免费推广引流怎么做
  • 哈尔滨网页模板建站百度公司总部
  • 禅城网站建设企业百度关键词数据
  • 网站建设及推广预算表seo顾问是什么职业
  • 使用ecs做主机做淘客网站互联网哪个行业前景好
  • 南海建设工程交易中心网站全国疫情最新
  • 成都个人学做网站网站模板图片
  • 德州做网站公司买号链接
  • 四川城乡建设厅官网seo技术服务外包公司
  • 简述电子商务网站建设的基本要求谷歌在线浏览器入口
  • 网站风格趋势百度网址链接是多少
  • 武城网站建设费用电商网站销售数据分析
  • 乌鲁木齐网站建设兼职seo服务销售招聘
  • 怎样用ps做电子商务网站苹果看国外新闻的app
  • 青岛开发区网站建设公司百度扫一扫入口
  • 廊坊建设部网站中国网络营销网