作者文章归档:王半仙

Jupyter 基础知识

Jupyter概述

Project Jupyter是一个非营利性的开源项目,诞生于2014年的IPython项目,该项目支持跨所有编程语言的交互式数据科学和科学计算,并承认永久性开源免费。

目前Jup

Read more

基于Excel的数据分析和可视化03

Importing Data from a CSV File

1. 加载前的设置

附件/Pasted image 20210829165618.png 附件/Pasted image 20210829165625.png 加载后导入数据的设置 附件/Pasted image 20210829165639.png

2. (Optional) From PDF to Data Model using Flash Fill

PDF中的表格数据直接复制到excel里时多列会变成一列。 因此需要使用Flash Fill进行列的拆分。 简单研究了一下 好像就是稍微智能一点的列拆分。。。 附件/Pasted image 20210829165715.png 官方示例

Read more

基于Excel的数据分析和可视化02

切片器slice

实现数据的快速筛选 附件/Pasted image 20210829163219.png

Data Model

数据模型允许您集成多个表中的数据, 从而在 Excel 工作簿中有效地生成关系数据源。

在 Excel 中, 数据模型透明地使用, 用于提供数据透视表和数据透视图中使用的表格数据。

创建数据模型官方示例

表关系

类似于传统数据库的表外键

表间关系示例: 附件/Pasted image 20210829163807.png

表间关系编辑: 附件/Pasted image 20210829163832.png

DAX

一种类似于sql 的针对数据分析的查询语法,最终作用和透视表类似,但可以实现一些逻辑更复杂的操作。DAX示例:

Let's assume a DAX formula used

Read more

基于Excel的数据分析和可视化01

vlookups

vlookups 查询(参数1)在(参数2)中匹配到的行对应的第(参数3)列的值

  • 第一个参数,显然,我们要让100003对应的是H4,这里就输入“H4,” ;
  • 第二个参数,这里输入我们要查找的区域(绝对引用),即“$A$2:$F$12,”;
  • 第三个参数,“全年总计”是区域的第六列,所以这里输入“6”,就会输入第四季度的项目了;(注意:这里的列数不是EXCEL默认的列数,而是查找范围的第几列)
  • 第四个参数,精确查找0/模糊匹配1

附件/Pasted image 20210829162543.png

缺点:性能较低

The reason t

Read more

8.《机器学习与神经网络》循环神经网络RNN(二)

1 Hessian-Free 优化概述

A brief overview of “Hessian-Free” optimization

1.1 最大的误差减小量

The maximum error reduc

Read more

7.《机器学习与神经网络》循环神经网络RNN(一)

1

Read more

6.《机器学习与神经网络》模型优化:如何加快学习

Read more

5.《机器学习与神经网络》用神经网络进行物体识别

1 图像识别的困难之处

Why object recognition is difficult

  • 图像割裂:很难决定部件与物体的归属关系,物体和物体也存在重叠问题
  • 光照:像素的亮度即会受到物体影响,也会受到光照影响
  • 变形:物体可能有多个形态,比如阿拉伯数字2的多种写法。
  • 分类的主观性:物体常常根据用途分类,同一个用途的物体常常有多

Read more

4.《机器学习与神经网络》词的向量表达

1 学会预测下一个词

Learning to predict the next word

1.1 关系信息

下图包含了家庭的关系信息,其

Read more