51CTO-Python数据分析系列视频课程”玩转文本挖掘”是一个专门针对Python数据分析领域的视频教程项目。该教程的目标是帮助学员学习使用Python进行文本数据的挖掘和分析。

该视频课程的内容非常详细,包括以下几个主要方面:

1. Python基础知识回顾:首先,该教程会对Python的基础知识进行回顾,包括Python的语法特点、变量和数据类型、条件语句和循环语句等。这些基础知识对于后续的文本挖掘工作非常重要。

2. 文本数据的预处理:文本数据在进行挖掘和分析之前,往往需要进行一系列的预处理工作。该教程会介绍如何对文本数据进行分词、去除停用词、处理词形变化等预处理操作。

3. 文本特征提取:文本挖掘的关键是提取有意义的特征表示。该教程会介绍常用的文本特征提取方法,如词频统计、TF-IDF、词袋模型等。学员将学习如何使用Python库(如NLTK、Scikit-learn等)来提取文本特征。

4. 文本分类和情感分析:文本挖掘的一个重要应用是文本分类和情感分析。该教程将介绍如何使用机器学习算法(如朴素贝叶斯、支持向量机等)对文本进行分类和情感分析,并演示如何使用Python进行实现。

5. 主题建模:主题建模是一种用于发现文本数据的潜在主题结构的技术。该教程将介绍如何使用Python库(如Gensim)进行主题建模,并演示如何解释和应用主题模型的结果。

6. 文本聚类:文本聚类是将文本数据自动分组的技术。该教程将介绍常用的文本聚类算法(如K-means、层次聚类等)和Python实现方法。

7. 文本挖掘案例分析:最后,该教程还会提供一些实际的文本挖掘案例分析,以帮助学员将所学知识应用到实际的项目中。学员将面对一些真实的文本数据,并通过实例分析和解决。

总体而言,51CTO-Python数据分析系列视频课程”玩转文本挖掘”是一套非常详细和全面的教学资源,适合希望学习使用Python进行文本数据挖掘和分析的学员。通过学习这些视频课程,学员将能够系统地掌握文本挖掘的基本理论和实践技巧,并能够应用到实际的数据分析项目中。

文本挖掘(TM),又称自然语言处理(NLP),是AI时代炙手可热的数据分析挖掘前沿领域,本次课程将会从基本的分词、词袋模型、分布式表示等概念开始,多面介绍文本挖掘技术的各个方面,特别会针对目前最热的word2vec,gensim 等结合实际案例进行学习,帮助学员直接升级至业界技术前沿。学习完本课程后,学员将能够独立使用Python环境完成中文文本挖掘的各种工作。

课程截图:

课程目录:
├──1-1 什么是文本挖掘.mp4 32.39M
├──1-2 文本挖掘的基本流程和任务.mp4 24.26M
├──1-3 文本挖掘的基本思路.mp4 21.74M
├──1-4 语料数据化时需要考虑的工作.mp4 26.11M
├──2-1 Python常用IDE简介.mp4 32.15M
├──2-2 Anaconda的安装与配置.mp4 31.21M
├──2-3 Jupyter Notebook的基本操作.mp4 25.51M
├──2-4 NLTK的安装与配置.mp4 30.69M
├──2-5 什么是语料库.mp4 60.50M
├──2-6 准备《射雕》语料库.mp4 59.96M
├──3-1 分词原理简介.mp4 32.60M
├──3-2 结巴分词的基本用法.mp4 33.28M
├──3-3 使用自定义词典和搜狗细胞词库.mp4 45.46M
├──3-4 去除停用词.mp4 52.25M
├──3-5 词性标注及其他.mp4 30.82M
├──4-1 词频统计.mp4 38.46M
├──4-2 词云概述.mp4 22.00M
├──4-3 wordcloud包的安装.mp4 37.31M
├──4-4 绘制词云.mp4 66.21M
├──4-5 设置词云背景模板.mp4 45.61M
├──4-6 修改词云颜色.mp4 53.05M
├──5-1 词袋模型.mp4 33.47M
├──5-2 词袋模型的gensim实现.mp4 56.38M
├──5-3 用Pandas生成文档词条矩阵.mp4 56.58M
├──5-4 用sklearns生成文档-词条矩阵.mp4 57.52M
├──5-5 从词袋模型到N-gram模型.mp4 27.33M
├──5-6 文本信息的分布式表示.mp4 29.78M
├──5-7 共现矩阵.mp4 23.38M
├──5-8 NNLM模型的突破.mp4 23.37M
├──5-9 word2vec一出,满座皆惊.mp4 53.30M
├──6-1 关键词提取的基本思路.mp4 24.67M
├──6-2 TF-IDF 算法.mp4 25.96M
├──6-3 TF-IDF算法的jieba实现.mp4 52.75M
├──6-4 TF-IDF算法的sklearn实现.mp4 27.91M
├──6-5 TF-IDF算法的gensim实现.mp4 27.38M
├──6-6 TextRank算法.mp4 41.64M
├──7-1 主题模型概述.mp4 48.98M
├──7-2 主题模型的sklearn实现.mp4 76.04M
├──7-3 主题模型的gensim实现.mp4 95.95M
├──8-1 基本概念.mp4 29.22M
├──8-2 词条相似度:word2vec训练.mp4 47.75M
├──8-3 词条相似度:word2vec应用.mp4 42.71M
├──8-4 文档相似度的词袋模型实现.mp4 42.60M
├──8-5 doc2vec.mp4 48.04M
├──8-6 文档聚类.mp4 41.86M
├──9-1 文本分类概述.mp4 40.29M
├──9-2 朴素贝叶斯算法.mp4 31.99M
├──9-3 算法的sklearn实现.mp4 49.09M
└──9-4 算法的NLTK实现.mp4 33.69M
├──10-1 情感分析概述.mp4 66.84M
├──10-2 情感分析的词袋模型实现.mp4 35.64M
├──10-3 情感分析的分布式表达实现.mp4 47.16M
├──11-1 自动摘要的基本原理.mp4 24.56M
├──11-2 自动摘要的效果评价.mp4 18.19M
├──11-3 自动摘要的python实现.mp4 38.16M
├──12-1 RNN的基本原理.mp4 23.30M
├──12-2 LSTM的基本原理.mp4 22.81M
├──12-3 Keras+TensorFlow组合的优势.mp4 9.88M
├──12-4 Keras+TensorFlow组合的安装.mp4 9.35M
├──12-5 案例1:数据准备.mp4 36.45M
├──12-6 案例1:模型拟合.mp4 31.85M
├──12-7 案例2:数据准备.mp4 37.53M
├──12-8 案例2:模型拟合.mp4 26.76M
├──资料
| ├──TM10-01.pdf 684.72kb
| ├──TM11-01.pdf 339.54kb
| ├──TM12n-01.pdf 783.83kb
| ├──TM2-01.pdf 876.99kb
| ├──TM3-01.pdf 1.07M
| ├──TM4-01.pdf 1.23M
| ├──TM5-01.pdf 767.66kb
| ├──TM6-01.pdf 721.23kb
| ├──TM7-01.pdf 829.94kb
| ├──TM8-01.pdf 961.02kb
| ├──TM9-01.pdf 635.82kb
| ├──TMData1801101-01.zip 7.19M
| ├──TMData190320-01.zip 7.27M
| ├──TM浣滀笟10-01.pdf 122.79kb
| ├──TM浣滀笟11-01.pdf 113.64kb
| ├──TM浣滀笟12-01.pdf 136.56kb
| ├──TM浣滀笟5-01.pdf 109.51kb
| ├──TM浣滀笟6-01.pdf 125.58kb
| ├──TM浣滀笟7-01.pdf 122.44kb
| ├──TM浣滀笟8-01.pdf 117.65kb
| ├──TM浣滀笟9-01.pdf 117.64kb
| ├──浣滀笟2-01.pdf 116.40kb
| ├──浣滀笟3-01.pdf 114.65kb
| └──浣滀笟4-01.pdf 117.18kb

声明:本站所发布的一切视频课程仅限用于学习和研究目的;不得将上述内容用于商业或者非法用途,否则,一切后果请用户自负。本站所有课程来自网络,版权争议与本站无关。如有侵权请联系联系客服QQ:1960026872或登录本站账号进入个人中心提交工单留言反馈,我们将第一时间处理!