自然语言处理实验演示 - 29. Jaccard 和余弦 (cosine) 相似度

4811
0
2021-09-27 12:21:47
正在缓冲...
52
8
97
21
我们已经学习了如何从文本中生成向量。然后,这些向量被输入机器学习算法,以执行各种任务。譬如,通过将两个字符串转换成向量来发现它们之间的相似性,该技术主要用于全文检索。有不同的技术可以找到两个字符串或文本之间的相似性。在本实验中,我们将使用两种方法计算文本相似度:Jaccard 相似度和余弦相似度。 个人用户获取视频内相关代码与数据集,请访问企业网站,扫描【知识微店(个人用户)】关注或订阅。 视频原创制作:广州跨象乘云软件技术有限公司 企业网站:https://www.080910t.com
21.2万播放
简介
NLP 基础
特征提取
文本机器学习
文本采集
主题建模
词向量
生成文本摘要
情感分析
大规模语言模型
文本清洗和分词
05:18
N-Gram
05:02
Keras TextBlob 文本分词
11:24
高级文本分词器
05:29
RegexpStemmer 词干提取
02:35
Porter 词干提取
02:07
执行词形还原
02:37
单复数变换
02:34
文本翻译
02:05
移除文本停用词
02:31
从新闻中提取热门关键词
03:07
文本通用特征提取
04:18
文本通用特征提取进阶
09:16
词袋模型
07:09
齐夫定律
06:53
TF-IDF 表示法
12:06
Jaccard 和余弦相似度
07:24
Lesk 词义消歧
04:14
中文词义消岐
07:25
词云生成
03:14
依存解析树与命名实体可视化
13:06
文本数据可视化
03:58
中文文本特征提取
08:25
客服
顶部
赛事库 课堂 2021拜年纪