在进行多方尝试后,我最后的选择是Anaconda + Pycharm,用anaconda集成的ipython做工作台,做一些分析和小段程序调试的工作,用Pycharm写相应脚本和程序包的开发。这两个工具都是跨平台的,也都有免费版本。

python操作总结

利用python进行数据分析

20170810

第1章 准备工作

cython
python是解释型语言,Java和C++是编译型语言,python慢
全局解释器锁GIL

  • NumPy(Numerical Python的简称)是python科学计算的基础包
  • pandas(panel data面板数据)提供大量数据结构和函数—–DataFrame
  • matplotlib 绘制数据图表
  • IPython是一个增强的python shell
  • SciPy是一组专门解决科学计算中各种标准问题域的包的集合

在python3.0问世以前,所有的python代码都是向后兼容的

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from numpy import *
数据规整munge/munging/wrangling
伪码pseudocode
语法糖syntactic sugar

第2章 引言

bit.ly
usa.gov

JSON:JavaScript Object Notation,这是一种常用的Web数据格式。
u’New_York’ 单引号前面的u表示Unicode(一种标准的字符串编码格式)
$\theta$

$\sum_{i=0}^n i^2 = \frac{(n^2+n)(2n+1)}{6}$

1、\v可以作为转义字符,表示纵向制表符,这里你把后斜杠全部改为前斜杠试试。建议以后凡是路径名中的\,全部改为\\或者/,以避免转义字符的歧义。

2、'C:\...'前面加r,r'C:\...'

python有许多内置或第三方模块可以将JSON字符串转换成Python字典对象。
DATaFrame是pandas中用于将数据表示为一个表格。
fillna函数可以替换缺失值(NA),而未知值(空字符串)可以通过布尔型数组索引加以替换。