《基于机器学习的文本挖掘》以R语言作为分析工具,通过详细案例介绍了文本挖掘的一般流程及如何使用贝叶斯分类器、最近邻、支持向量机、决策树等机器学习算法处理特征选择、分类、聚类文本挖掘领域经典任务。书籍第一章对机器学习与文本挖掘技术做了综述;第二章系统介绍了用于文本挖掘的主流编程语言R;第三章介绍了文本结构化表示方式;第四至十一章介绍了文本挖掘中的分类问题及如何实现机器学习算法解决分类问题;第十二章介绍了文本聚类及实践方式;第十三至十四章介绍了当前主流词嵌入方法及特征选择方法。
本书结合实际语料案例向读者介绍并实现当前机器学习的主流分类算法、聚类算法、词嵌入特征选择等技术,为人文社科领域学者理解和深入学习文本挖掘提供了明晰的解释和系统的实施路径。如果读者希望了解与文本挖掘相关的各类机器学习算法及如何用R包进行实践,相信该书能够提供明晰的解释和便捷的方案。