神策数据实习

1. 笔试

拓扑排序:可以实现有向图以及无向图判断是否有环存在。

稳定排序算法:归并排序、基数排序、冒泡排序和直接插入排序

2. 面试

时间很短,每人只有15分钟,本人大概面试了20分钟左右,面试官不是做算法的,技术能力很强(认识…),效果不理想,主要是自己菜—>.

问题1:描述一下过拟合。

问题2:给一些数据,如何选取模型去挑选数据,判断与随机取数据的好坏。

问题3:分布式了解吗?MR工作机制?

问题4:给文章数据让你统计词频,你怎么实现会有哪些问题?大量数据怎么处理?正常字典法请手撕代码。

问题5:针对于分词那么换行问题“hell-\nO world”如何处理,文章应当一部分一部分去处理,如果分句针对较长的句子该怎么办?(面试官不看好replace(“-\n”,””))我也没有合适的解决方案…..