备案号:辽ICP备19007957号-1
聆听您的声音:feedback@highmark.com.cn企业热线:400-778-8318
Copyright ©2015- 海马课堂网络科技(大连)有限公司办公地址:辽宁省大连市高新技术产业园区火炬路32A号创业大厦A座18层1801室
与其被 “论文拖延症” 折磨,不如一开始就找对方法,海马课堂论文辅导将会为大家详细介绍数据科学的写作指南,对于有疑问的同学,可以随时与我们的在线客服进行沟通哦。
数据科学论文其实可以一句话概括:“为读者而写,而不是为自己而写。”
数据科学是一个复杂的领域,其间繁多的算法、性能指标和数据结构,即便对最资深的从业者来说也很难完全掌握。因此,作为作者,你的职责是尽可能帮助读者消化你的研究,在能引导与能澄清的地方主动做引导与澄清。让问题更复杂谁都能做到,而把复杂问题讲清楚、讲简单,才是真正考验功力的地方。

引言
务必以一个引言开篇,告诉读者接下来可以期待什么。关键是让引言足够具体。不要只说你会做文献综述、收集数据、建立模型——而要预告你具体将研究什么、收集什么数据、要建模哪些结构或决策。学术写作与靠延宕情节制造悬念的精彩小说恰恰相反——学术读者不喜欢惊喜。恰当的引言会提供一个框架,帮助读者为后续内容建立结构性预期。
正文
正文将占据主要篇幅,因此必须清晰地组织结构。事先思考你想传达的关键信息。通常,先写出文本的“骨架”会很有帮助(例如:章节主题、段落目的、每段一句要点)。检查这些信息是否按逻辑顺序排列,并能形成一个连贯的叙事。尽量做到每段只有一个关键信息。没有预设结构与清晰信息,正文就很容易沦为公式、数据结构与实验结果交织的一团乱麻。
结论
无论是整篇论文、某一章,甚至一个段落,都要以明确的结论或总结收尾。你的读者很可能不会阅读、记住或理解你写下的每一个细节。当然,结论的长度应与其所归纳的对象相称:对于整篇论文,通常是一整章结论;而对一个段落,一句收束即可。以有力的收尾结束,对你的论文至关重要。
真正读懂一篇论文是件辛苦的事;读者需要尽可能多的帮助。你作为作者,可能连续数周沉浸在这个主题里,但对读者而言,你的论文很可能只是众多需要略读的文档之一。事实上,极少有人会从头到尾通读你的工作。因此,作为作者,你有责任尽量帮助读者。把你在 10 页之前提到的 ω_t 复述一遍。解释 AUC=0.7 实际意味着什么。说明你为什么要做那个 t 检验。不要假设读者会自己把碎片拼起来——要主动努力,引导你的受众走过你的研究路径。
在选择技术时,问题应始终起主导作用。追逐本周最火的机器学习新潮很诱人,但它很可能并不是这项任务的最佳工具。首先:
(i) 研究你的问题情境;
(ii) 定义合适的研究问题;
(iii) 设定需求与约束;
(iv) 分析你的数据集;
(v) 确定成功标准。
只有完成了这些,才能就合适的解决方法做出信息充分的决策。客观地说,论文项目通常比日常工作有更多的探索空间——毕竟,有时公司只是想看看某个新东西行不行。尽管如此,也要始终让“问题”驱动“方法”,而不是本末倒置。
数据科学论文往往会在细枝末节上深挖,比如微调超参数或进行大量实验。这本身没有问题。然而,如果你试图解决的问题从一开始就不清楚(问题陈述、情境分析),或者你的实验结果从未回扣到最初的研究动机(结论、建议),那么就错过了让研究产生有意义影响的机会。下面这些结构可能有助于把你的工作“翻译”出来:
沙漏模型:从企业/社会层面的宏观问题广泛切入,逐步聚焦到技术层面,然后再把结果翻译回管理层面的洞见。
双钻石模型:在研究阶段与设计阶段交替进行发散与收敛思考。有意识地安排探索期与聚焦期。
你的大部分工作很可能发生在“内容层”(数据收集与清洗、建模、参数调优、实验)。但是,别忘了先搭好舞台,最后以有说服力的“大结局”收尾。
努力识别能刻画你的研究成功与否的关键指标。为获得平衡视角,通常需要报告多个指标(精准率、召回率、AUC、F1 分数等)。但应避免在缺乏整体解读的情况下仅仅罗列一堆指标。你的欺诈检测模型 98.3% 的准确率听起来很棒,但对其实际可用性说明不多。你的结果表里罗列了上百个指标,很令人印象深刻,但你能用一句话抓住其关键信息吗?与基线模型相比,更高的精准率但更低的召回率算不算改进?要从多个角度深入剖析你的结果,但也务必把关键结论提炼到能放进一条 Twitter 摘要的程度。
本文讨论了五条有助于撰写数据科学论文的建议。贯穿始终的原则是:始终把读者放在心上,并在结构、解释与阐释上多做一步,主动为目标读者服务。五条建议可概述如下:
引言、正文、结论——在文本的各个层级(论文、章节、小节、段落)保持一致的结构,以引导性提纲或提示开篇,以总结或结论收尾。
回顾、解读、解释——成功的论文会引导读者走过你的研究,为你的技术与结果提供有帮助的解释。
选择适合问题的解决方案——在选定解决方法之前,务必充分研究问题、情境与期望,让方法契合任务本质。
开始要宽、结束也要宽——深入细节完全可以,但别忘了:(i) 清晰勾勒问题情境;(ii) 把主要发现转化为可落地的洞见。
明确关键指标——单一指标很少能捕捉分析的全貌,但最终仍需要把研究提炼成若干可消化的数字。
阅读原文:https://www.highmarktutor.com/news/29943_61.html
版权作品,未经海马课堂 highmarktutor.com 书面授权,严禁转载,违者将被追究法律责任。
24h在线客服



备案号:辽ICP备19007957号-1
聆听您的声音:feedback@highmark.com.cn企业热线:400-778-8318
Copyright ©2015- 海马课堂网络科技(大连)有限公司办公地址:辽宁省大连市高新技术产业园区火炬路32A号创业大厦A座18层1801室
hmkt088