统计211

标题: 给正在为数据挖掘研究方向抓狂的同学们一些建议 [打印本页]

作者: 晚风    时间: 2011-7-27 20:22
标题: 给正在为数据挖掘研究方向抓狂的同学们一些建议
    在论坛和群上经常有很多正在攻读数据挖掘方向的研究生们提出一些关于数据挖据到底要研究什么的建议。事实上,我并不是太清楚中国的研究生培养方向上什么时候一下子冒出那么多数据挖掘专业来了。更有甚者,在一些学校的管理学院也开始设立数据挖掘研究方向了,这似乎在明着抢计算机学院的饭碗。不过,数据挖掘目前在应用上也是市场营销理念的落地,因此管理学院开设数据挖掘专业似乎也无可厚非。事实上,我们看一些国外与数据挖掘相关的文章时,不难发现作者一般都是来自数学系,统计学系或者计算机系,而数据挖掘只是统计学、人工智能或者机器学习理论的一种实际应用。反观我们的学术研究,由于数据挖掘是一个国际上非常热门的课题,因此老师们都竞相通过这个方向申请硕士、博士点,申请国家的研究基金,评硕导或者博导。
    事实上,我觉得大部分数据挖掘的指导老师确实也对数据挖掘的研究方向是比较模糊的。数据挖掘一开始就是一个面向应用的题目,由于数据的大量积累所以才催生应用,催生了挖掘,数据挖掘的应用总是从某一个行业的需求发展起来的,要寻找新的应用点则需要对某个行业的业务有非常深刻的了解,这往往是我们高校不具备的。高校的长处始终是理论研究,因此对数据挖掘的研究应该回归到统计学、人工智能或者机器学习等领域的相关基础理论、算法研究层面上。而在数据挖掘的商业应用上也是如此,目前数据挖掘的从业者一般都是数学专业、统计学专业、计量经济学专业或者计算机专业的毕业生。在商业上目前还是以统计学模型的应用为主,这是因为统计学模型的理论基础更加扎实而且模型的结果具有更好的可解释性。作为从业者,需要对每种统计学模型的理论,思想和应用范围都了然于胸,才能使其在实际当中得到更充分的运用。
    目前国际上对数据挖掘的研究也是集中在算法和模型的综合运用,使其发挥出更大的威力,毕竟在算法和理论上获得突破是件相当困难的事情。因此,数据挖掘方向的研究不妨把目光放到统计理论、机器学习等基础研究,或者统计学和机器学习、人工智能等技术的交叉运用上。另外,一些与人文有关的课题也可能是有意义的研究方向,如人的社会关系网研究,这些都是可以通过数据挖掘技术结合人文科学理论得到比较好的运用。

(江宇闻的原创文章,转载请注明出处)




欢迎光临 统计211 (http://tj211.com/) Powered by Discuz! X3.2