欢迎使用题易搜网站

题易搜

离线详情

大连理工大学-《数据挖掘》课 程 大 作 业

发布文件:2024-08-24 49 次 10金币

国开、奥鹏所有的在线答案、离线答案都可在首页进行搜索,搜不到的可以联系客服!所有答案都有!右下角微信扫码可以添加客服微信。

答案已添加至底下文档中,可登录下载完整版。

第一大题:讲述自己在完成大作业过程中遇到的困难,解决问题的思路,以及相关感想,或者对这个项目的认识,或者对Python与数据挖掘的认识等等,300-500字。

                                                                    

                                                                    

                                                                     

 

第二大题:完成下面一项大作业题目。

 

2020秋《数据挖掘》课程大作业

注意:从以下5个题目中任选其一作答。

题目一:Knn算法原理以及python实现

    :文档用使用word撰写即可。

        主要内容必须包括:

1)算法介绍。

2)算法流程。

3python实现算法以及预测。

4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP

题目二:朴素贝叶斯算法原理以及python实现

    :文档用使用word撰写即可。

        主要内容必须包括:

1)算法介绍。

2)算法流程。

3python实现算法以及预测。

4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP

题目三:SVM算法原理以及python实现

    :文档用使用word撰写即可。

        主要内容必须包括:

1)算法介绍。

2)算法流程。

3python实现算法以及预测。

4)整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP

题目四:中华古诗词分析

    求:编写程序爬取中华古诗词网站

https://so.gushiwen.org/authors/上诗人的诗词信息,至少500首诗词,抽取诗词信息的诗人名字、朝代、诗词标题、诗词内容存储在json文件中,自选某一角度完成对诗词的处理分析。如:

1)杜甫、李白的诗词用字、用词的对比分析;

2)唐宋代表性诗词的用词对比分析;

3)使用sklearn对不同诗人的诗词进行训练,训练得到的模型能用于对诗词的作者的判别。对比不同算法判别的准确率。

4整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP

题目五:歌词分析

    求:自选有音乐歌词的网站,编写爬虫程序下载不同类型的歌曲歌词,至少3种以上类型,每种类型至少100首歌曲,抽取其中的歌曲名称、歌曲类型、歌词信息存储在json文件中,自选某一角度对歌词进行处理分析。如:

1)不同类型的歌曲用词分析,如下图所示(自行学习使用jieba库和wordcloud库的使用)。

2)使用sklearn库对不同类型的歌词进行训练,训练得到的模型能用于对歌词类型的判别。对比不同算法判别的准确率。

3整个word文件名为 [姓名 奥鹏卡号 学习中心](如戴卫东101410013979浙江台州奥鹏学习中心[1]VIP

您需要登录才可以下载或查看,没有账号?会员注册