自然语言处理实验演示 - 34. 文本数据层次聚类 (Hierarchical Clustering)

3321
1
2021-10-02 06:34:18
正在缓冲...
58
12
94
12
无监督学习是指算法在没有标记的数据中学习模式的方法。由于没有标签 (监督者),这被称为无监督学习。在本实验中,我们将分析 sklearn 的 fetch_20newsgroups 数据集中的文本文档。 fetch_20newsgroups 数据集包含关于 20 个不同主题的新闻文章。我们将利用层次聚类将文档分成不同的组。完成集群分类之后,我们将把机器学习的分类结果,与实际的类别进行比较。 个人用户获取视频内相关代码与数据集,请访问企业网站,扫描【知识微店(个人用户)】关注或订阅。 视频原创制作:广州跨象乘云软件技术有限公司 企业网站:https://www.080910t.com
21.2万播放
简介
NLP 基础
特征提取
文本机器学习
文本采集
主题建模
词向量
生成文本摘要
情感分析
大规模语言模型
文本数据层次聚类
10:27
K 均值文本聚类
11:56
逻辑回归文本分类
14:37
朴素贝叶斯文本分类
08:40
K 近邻文本分类
05:28
文本数据回归分析
06:44
决策树文本分类与评分预测
09:53
随机森林文本分类与评分预测
11:30
XGBoost 文本分类与评分预测
10:31
数据采样
07:35
移除高度相关特征
12:14
文本 PCA 降维
06:37
模型评估指标
07:51
构建 NLP 项目工作流
04:51
模型保存与重加载
04:21
开发端到端文本分类器
06:08
中文诈骗骚扰短信识别
08:16
神经网络命名实体识别
13:00
客服
顶部
赛事库 课堂 2021拜年纪