Jun的个人随笔

  • 首页

  • 标签

  • 分类

  • 归档

  • 搜索

TF-IDF算法介绍

发表于 2019-07-05 更新于 2019-07-07 分类于 机器学习

TF-IDF定义TF-IDF(term frequency–inverse document frequency,词频-逆向文件频率)是一种加权技术。采用一种统计方法,根据字词在文本中出现的次数和在整个语料中出现的文档频率来计算一个字词在整个语料中的重要程度。 TF-IDF的主要思想TF-IDF是一 ...

阅读全文 »

动态规划

发表于 2019-07-04 更新于 2019-07-05 分类于 数据结构

定义动态规划与分治方法相似,都是通过组合子问题的解来求解原问题。分治方法将问题划分为互不相交的子问题,递归地求解子问题,再将它们的解组合起来,求出原问题的解。与之相反,动态规划应用于子问题重叠的情况,即不同的子问题具有公共的子子问题(子问题的求解是递归进行的,将其划分为更小的子子问题)。动态规划算法 ...

阅读全文 »

Attention机制整理

发表于 2019-07-03 更新于 2019-07-05 分类于 深度学习

Attention的定义与作用按照Stanford大学课件上的描述,attention的通用定义如下: 给定一组向量集合values,以及一个向量query,attention机制是一种根据该query计算values的加权求和的机制。 attention的重点就是这个集合values中的每个va ...

阅读全文 »

作业帮算法卷笔试

发表于 2019-07-02 更新于 2019-07-05 分类于 个人笔经面经

博主问题笔记不包含博主经历所有题目只记录典型问题(估计也差不多全部了,因为博主菜…..) 问题1:交叉熵公式 解答:交叉熵公式如下: H(x,y) = -\sum_{i=1}^nx_i\ln{y_i}这里公式定义,x、y都是表示概率分布。其中x是正确的概率分布,而y是我们预测出来的概率分布,这个公 ...

阅读全文 »

Line实习面

发表于 2019-07-01 更新于 2019-07-05 分类于 个人笔经面经

1. 笔试问题1:平衡二叉树的性质(笔者菜,画蛇添足了…) 正确解答:平衡二叉树或者是棵空树,或者是具有下列性质的二叉树: 它的左子树和右子树都是平衡二叉树,且左子树和右子树的深度之差的绝对值不超过1。 若将二叉树节点的平衡因子(Balance Factor)定义为该节点的左子树的深度减去它的右子 ...

阅读全文 »

MapReduce原理与排序应用

发表于 2019-07-01

1. MapReduce工作机制MapReduce执行总流程 MapReduce Framework如上图所示。 JobTracker: 初始化作业,分配作业,与TaskManager通信,协调整个作业的执行 TaskTracker: 保持与JobTracker的通信,执行map或者reduce任 ...

阅读全文 »

神策数据实习

发表于 2019-07-01 分类于 个人笔经面经

1. 笔试拓扑排序:可以实现有向图以及无向图判断是否有环存在。 稳定排序算法:归并排序、基数排序、冒泡排序和直接插入排序 2. 面试时间很短,每人只有15分钟,本人大概面试了20分钟左右,面试官不是做算法的,技术能力很强(认识…),效果不理想,主要是自己菜—>. 问题1:描述一下过拟合。 问题 ...

阅读全文 »

经典笔试——找到数组第k大或第k小的数

发表于 2019-06-30 分类于 数据结构

1. 问题在未排序的数组中找到第k个最大的元素,找到数组排序后的第k个最大的元素。 示例: 输入: [3,2,3,1,2,4,5,5,6] 和 k=4 输出:4 2. 解题思路类快速排序思想,找到数组中元素的位置,当分界点的索引为k-1的时候,它就是第k大元素,第k小的数只需找(组数长度+1-k)大 ...

阅读全文 »

支持向量机(SVM)原理与推导

发表于 2019-06-30 更新于 2019-07-30 分类于 机器学习

1. 支持向量机的原理Support Vector Machine (SVM)是一种二类分类模型。它的基本模型是在特征空间中寻找间隔最大化的分隔超平面的线形分类器。(间隔最大是它有别于感知机),通过该超平面实现对未知样本集的分类。 当训练样本线性可分时,通过硬间隔最大化,学习一个线性分类器,即线性 ...

阅读全文 »

快速排序

发表于 2019-06-30 分类于 数据结构

快速排序1. 介绍快速排序是一种高效的排序算法,它采用“分而治之”的思想。其原理是:对于一组给定的记录,通过一趟排序后,将原序列分成两部分,其中前部分的所有记录均比后面部分的所有记录小,然后再依次对前后两部分的记录进行快速排序,递归该过程,直到序列中的所有记录均有序为止。 具体算法步骤如下: (1) ...

阅读全文 »
1234

NI,JUN

33 日志
6 分类
50 标签
GitHub E-Mail
© 2022 NI,JUN
由 Hexo 强力驱动 v3.9.0
|
主题 – NexT.Gemini v7.2.0