Record 1:20190924
开学已经两周多了,已经进入了比较正规也紧张的学习环境中,有些琐碎的内容不知如何说起,暂且提纲如下
1 Data Science(数据科学)对我而已主要作为进入IT领域的路径探索。重复CS本科的内容不可能也不必要,更何况我对学校/公办教育已经比较失望了。
这学期修4门专业课,概率、大数据管理、机器学习和数据可视化,整个专业的设定是非科班但有一定量化分析背景,所以只会教怎么用算法而涉及设计算法的程度。这给我一定缓冲空间,但可能也带来一些一知半解的问题。
2 学习资源有些更充沛了,有些更狭窄了。
从英语中获取信息,而不仅过中介本身对学习以英语为媒介的内容有莫大优势。这边行业交流还是比较活跃的。学校和校外时常场有培训型的workshop;上周去了一个讲座听一个做数据分析/可视化多年的人士讲一些行业基本情况,大家都很实在,不吹不黑只捞干的说。
基础科学研究总体薄弱,相关基础学科比如纯数学的本科只在两个大学有,这对CS等IT领域会一直带来持续的制约;与个别本科(应用)数学专业的人交流,如果对方不是刻意隐瞒或者嘲讽我觉得可能缺乏很多计算机专业从业者所强调的那种基本数学素养,这种人也能毕业可见一斑。书店里理工科书籍非常缺乏,跟国内大一点的书店里有土木工程、化工类书相比这边IT类书籍非常匮乏。学校图书馆藏书不少,新书和好书不缺而且容易借阅但管理不善检索困难。
同学的构成比较有趣,多数是同时全职工作的人,与一部分交流过,动机有的是与职业相关有的是作为技能储备。从这个可以窥见部分工业界的情况。从同学自我更新不断充实的努力中感到有些触动,当然也人家一般也不面临“30挨踢”的问题。
3 学习的革命更清晰
传统的统计学设定于个人演算、静态小规模数据(相对与动态大数据),这与我们现在面对的情况非常不同,而数学基础理论的(到20世纪上半页)构建多是在计算机之前。花2小时用传统方法学习与计算机算法相关的200年前的数学(随便举一个 比如拓扑基础上的概率论入门部分)获得的是个体的、纸笔式的知识和经验,而我们要应用到团队化、以高性能计算机为工具的研究/实践项目中。
也许有门学问叫“数学转化学”(参考 “translational medicine”),我在想能不能探索初级的“人机共同学习”,不只是用电子设备记笔记/管理数据,而是一部分信息由人来把握另一部分以半成的程序、信息结构由电脑来把握,实际上有些编程入门到数据结构的学习过程符合“人机共同学习”——两者分别对应对基本句法和应用库的了解和编过的练习程序、为进一步学习做参考的设计框架。这种学习模型能不能推广到实分析与复分析、线性代数、抽象代数、概率论、统计学。。?这可能涉及教学方式、学习材料的诸多革新,有些目前各界完全没有准备好,甚至可能涉及机器自动证明等既是基础研究又是应用工具的开发问题(证明定理本身或者证明定理的数量作为数学学习必要性的重新评估)。
4 项目,还是项目
这学期四门课全部要求小组项目,虽然只占总成绩20%左右却起到提纲契领引导整个学期过程的作用。一开始就要求分组,而我对大多数人都不了解,很多人彼此也不熟悉,再加上一些彼此熟识的人只选择对方作为搭档,分组显得略艰难。但这一天终于到了,再也不是那种主要依赖老师学习的时候了,只能刀锋带动镰锋,探索短时间内尽可能熟悉更多人、在小组项目中彼此学习取长补段形成合力(synergy)机制。