自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (15)
  • 论坛 (1)
  • 问答 (4)
  • 收藏
  • 关注

原创 面试小结(持续更)

前言:天将降大任于斯人也,必先苦其心志,劳其筋骨,饿其体肤,空乏其身,行拂乱其所为,所以动心忍性,曾益其所不能。1.作业帮(算法/数据挖掘实习生)(1)从海量数据中找出前1000个最大数解决方案:先选出1000个数来建立一个小根堆(时间复杂度为o(m),m为堆的大小),然后遍历剩下的元素,如果当前元素比堆顶元素(最小的数)小,则丢弃;反之则替换堆顶元素,进行堆调整即可(时间复杂度为n*log(m)...

2018-03-18 12:19:32 332

原创 简单理解基数排序

        基数排序主要有两个步骤:分配和收集。现假设有一个十进制数组{1,56,2,36,18,60,235,17},那么我们就需要把数据分配到十个“桶”中去,首先我们根据数字的个位上的数进行分配,分配结果如下:"0"号桶:60"1"号桶:1"2"号桶:2"3"号桶:"4"号桶:"5"号桶:235"6"号桶:56 36 "7"号桶:17&quo

2018-03-12 20:19:50 344

原创 排序算法小结

        排序算法在面试中是必过的一道关,因此今天我们就来简单总结一下各种排序算法的思想及代码实现(C/C++版)。为了讨论各算法的时间复杂度和稳定性,我们以同一实例进行分析:5 3 6 5 2 1 5(递增排序)。1. 交换排序1.1 冒泡排序冒泡排序的基本思想是:从第一个元素开始与其下一元素进行比较,若是当前元素比下一个元素大则进行交换,反之则不进行任何操作。当全部遍历一遍整...

2018-03-08 19:28:37 173

原创 朴素贝叶斯面试总结

1. 朴素贝叶斯与LR的区别?简单来说:朴素贝叶斯是生成模型,根据已有样本进行贝叶斯估计学习出先验概率P(Y)和条件概率P(X|Y),进而求出联合分布概率P(XY),最后利用贝叶斯定理求解P(Y|X), 而LR是判别模型,根据极大化对数似然函数直接求出条件概率P(Y|X);朴素贝叶斯是基于很强的条件独立假设(在已知分类Y的条件下,各个特征变量取值是相互独立的),而LR则对此没有要求;朴素贝叶斯适用...

2018-03-06 22:51:12 4570

原创 深入了解LR

深入了解LR

2018-03-05 17:57:53 389

原创 线性回归,原来我一直都不懂你...

本文将首先介绍简单的一元线性回归及其最小二乘解法;然后介绍多元线性回归,并用最小二乘法、梯度下降法进行求解,最后重点讨论多元线性回归多种解法的优缺点。

2018-03-03 18:45:22 3458

原创 求解链表是否存在环、环中节点个数、环的起始结点

0. 定义结点并创建链表代码实现:struct ListNode // 定义节点{ int val; struct ListNode * next; ListNode(int x):val(x),next(NULL){}};ListNode* CreateLinkList(int n, int m) // 创建一条长度为n的链表,在第m个位置设置环的起始点{ if(n<=0...

2018-03-02 21:48:31 566

原创 Apriori算法与FP-Tree简介

1. 背景介绍       从“啤酒与尿布”的案例中,我们得知人们在购买商品时是存在一定的规律的,因此找出这些商品的关联是一件非常有价值的事情。那么,我们如何确定哪些商品是有关联的呢?下面以图一为例,简单介绍三个重要的评估标准。图一 1.1 支持度        支持度:{X,Y}同时出现的概率。Support(X, Y) = X,Y 同时出现的数量 /  总样本的数量。按照图一所给数据,Supp...

2018-03-01 18:34:35 1232

xgboost源代码

本人通过亲自实践,教大家一步步在win下安装xgboost(http://blog.csdn.net/jingyi130705008/article/details/71435562),这个是之前的xgboost的C++版本,是在python使用xgboost之前必须的包。

2017-05-08

采用fasttext对文本公告进行分类

该代码文件包括以下几个部分: (1)nlp_utils.py 数据功能处理函数 (2)fast_text_train.py 训练代码 (3)fast_text_predict.py 利用meta模型预测代码 (4)frozen_graph.py 模型固化及预测代码 (5)saves 训练得到的模型文件 (6)word2id_dict.txt、label2id_dict.txt 训练时得到的字典文件

2020-07-08

数据分析之统计分析操作.xlsx

excel分析方法:描述统计、Z检验、F检验、t检验、方差分析。https://blog.csdn.net/jingyi130705008/article/details/106599260

2020-06-12

geoip2.database包 GeoLite2-City.mmdb

geoip2 可解析出ip的位置和所在城市等信息,GeoLite2-City.mmdb数据库,仅供学习使用。

2020-10-23

bilstm_crf_code.tar.gz

该代码完整实现了基于bilstm+crf的tensorflow实现,可训练、预测。 ├── Batch.py # 实现batch功能 ├── bilstm_crf.py # 模型定义 ├── data # 数据文件夹 │   ├── Bosondata.pkl # 训练数据的输入(加工后) │   ├── generate_dataset.py # 数据加工脚本,将原数据处理成模型需要的格式 │   └── wordtagsplit.txt # 原数据 ├── train.py # 训练相关的代码 └── utils.py # 功能函数

2020-07-24

time_series_covid19_deaths_global.csv

time_series_covid19_deaths_global.csv

2021-01-22

births_transformed.csv.gz

博客https://blog.csdn.net/jingyi130705008/article/details/102941161 所需数据集

2004-04-03

asp.net考试系统可参考源码含数据库

asp.net考试系统可参考源码含数据库

2015-12-28

additionalCode.tar.gz

博客代码 https://blog.csdn.net/jingyi130705008/article/details/103027824

2019-11-12

表达式后置代码实现

数据结构关于栈的应用:对于复杂的表达式后置C语言的实现,

2015-06-20

数据分析之数据处理操作.xlsx

Excel 数据中的数据分析功能提供了常用的一些数据处理技巧:随机数发生器、抽样、排位与百分比排位、指数平滑、移动平均、直方图。

2020-06-07

python_dateutil-2.6.0-py2.py3-none-any.whl

dateutil模块

2017-04-23

MySQL安装文件及安装教程

mysql版本:mysql-5.5.36-win32;有详细的安装说明及卸载说明。

2018-04-07

pandas-0.16.0rc1.win32-py2.7.exe

下载pandas-0.16.0rc1.win32-py2.7.exe,双击运行即可安装

2017-04-23

C语言实现五子棋

用C写一个简单的五子棋游戏,还有人机对战呢!

2015-06-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除