自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (15)
  • 论坛 (1)
  • 问答 (4)
  • 收藏
  • 关注

原创 pyspark 模块化代码

期望实现的功能:建立一个模块,计算出两点间的直线距离(单位为英里),并且将计算结果从英里转换成千米。1. 创建模块文件组织结构如下:setup.py: 打包用户自定义的功能模块from setuptools import setupsetup( name='PySparkUtilities', version='0.1dev', packages=['...

2019-11-12 14:30:10 242

原创 PySpark 之 GraphFrames简介

GraphFrames可以快速轻松地分析以图形结构组织的数据,边和顶点由DataFrame表示,允许我们存储每个节点和边的任意数据。简单示例如下:# encoding=utf-8import osimport pysparkfrom pyspark.sql import SparkSessionfrom pyspark.sql import types as typfrom p...

2019-11-11 19:05:44 2349

原创 pyspark ml 中LDA简单示例

# encoding=utf-8import osimport pysparkfrom pyspark.sql import SparkSessionimport pyspark.sql.types as typimport pyspark.ml.feature as ftimport pyspark.ml.clustering as clusfrom pyspark.ml imp...

2019-11-07 14:44:11 786

原创 pyspark ml 中LogisticRegression的使用

前置概念ML包公开了三个主要的抽象类:转换器(transformer)、评估器(estimator)和管道(pipeline)。转换器,通常通过将一个新列附加到DataFrame来转换数据,其常见参数有inputCol(所要转换列的名称,默认为features)和outputCol(转换后新增的新列名称).评估器,可以理解为需要评估的统计模型,常用来做分类、回归、聚类等。管道,用来...

2019-11-06 19:13:33 1016

原创 python多进程示例

下面这个示例的功能包含:(1)实现python多进程;(2)进程间共享变量company_queue (通过Manager().Queue()实现)(3)每个进程最后输出一个独立的结果(保存路径通过参数传入);(4)实现json数据整合成一个dataframe并输出到文件(支持csv和excel两种格式);(5)部分函数的具体实现略去。示例代码:#coding=...

2019-11-05 20:46:48 171

bilstm_crf_code.tar.gz

该代码完整实现了基于bilstm+crf的tensorflow实现,可训练、预测。 ├── Batch.py # 实现batch功能 ├── bilstm_crf.py # 模型定义 ├── data # 数据文件夹 │   ├── Bosondata.pkl # 训练数据的输入(加工后) │   ├── generate_dataset.py # 数据加工脚本,将原数据处理成模型需要的格式 │   └── wordtagsplit.txt # 原数据 ├── train.py # 训练相关的代码 └── utils.py # 功能函数

2020-07-24

geoip2.database包 GeoLite2-City.mmdb

geoip2 可解析出ip的位置和所在城市等信息,GeoLite2-City.mmdb数据库,仅供学习使用。

2020-10-23

xgboost源代码

本人通过亲自实践,教大家一步步在win下安装xgboost(http://blog.csdn.net/jingyi130705008/article/details/71435562),这个是之前的xgboost的C++版本,是在python使用xgboost之前必须的包。

2017-05-08

采用fasttext对文本公告进行分类

该代码文件包括以下几个部分: (1)nlp_utils.py 数据功能处理函数 (2)fast_text_train.py 训练代码 (3)fast_text_predict.py 利用meta模型预测代码 (4)frozen_graph.py 模型固化及预测代码 (5)saves 训练得到的模型文件 (6)word2id_dict.txt、label2id_dict.txt 训练时得到的字典文件

2020-07-08

time_series_covid19_deaths_global.csv

time_series_covid19_deaths_global.csv

2021-01-22

births_transformed.csv.gz

博客https://blog.csdn.net/jingyi130705008/article/details/102941161 所需数据集

2004-04-03

asp.net考试系统可参考源码含数据库

asp.net考试系统可参考源码含数据库

2015-12-28

additionalCode.tar.gz

博客代码 https://blog.csdn.net/jingyi130705008/article/details/103027824

2019-11-12

表达式后置代码实现

数据结构关于栈的应用:对于复杂的表达式后置C语言的实现,

2015-06-20

数据分析之数据处理操作.xlsx

Excel 数据中的数据分析功能提供了常用的一些数据处理技巧:随机数发生器、抽样、排位与百分比排位、指数平滑、移动平均、直方图。

2020-06-07

python_dateutil-2.6.0-py2.py3-none-any.whl

dateutil模块

2017-04-23

MySQL安装文件及安装教程

mysql版本:mysql-5.5.36-win32;有详细的安装说明及卸载说明。

2018-04-07

数据分析之统计分析操作.xlsx

excel分析方法:描述统计、Z检验、F检验、t检验、方差分析。https://blog.csdn.net/jingyi130705008/article/details/106599260

2020-06-12

pandas-0.16.0rc1.win32-py2.7.exe

下载pandas-0.16.0rc1.win32-py2.7.exe,双击运行即可安装

2017-04-23

C语言实现五子棋

用C写一个简单的五子棋游戏,还有人机对战呢!

2015-06-20

TA创建的收藏夹 TA关注的收藏夹

TA关注的人 TA的粉丝

提示
确定要删除当前文章?
取消 删除