德国宝马汽车公司主要生产三种汽车,一是轿车,分3、5、7系;二是越野车,为X5系;三是敞篷跑车,分Z3、Z8系;四是硬顶跑车,有M系等。
宝马轿车的命名方法一般是将“系名”放在最前面,随后为代表发动机排量的数字,最后的英文字母“i”表示发动机是电子喷射,“A”表示自动档,“C”表示为双座跑车(Coupe),“L”表示为长轴距。如318iA——3系、发动机排量1.8升、电子喷射、自动档。
原来代表发动机排量的数字与排量极为近似,但随着车型的不断更新,有时为了市场需要,后来个别车型又将发动机的排量增大一些,但仍采用老型号,如750i,它的发动机排量为5.4升;540i的发动机排量为4.4升。但是,宝马车型号中的排量代表数字,大部分与发动机排量近似。

为何英特尔酷睿处理器的编号都是奇数?

为何英特尔酷睿处理器的编号都是奇数?例如i(m)3,i(m)5,i(m)7之类的。

老问题了,之所以是用奇数来命名型号,纯粹是市场营销的手段。

实际上每种CPU都有内部识别的型号,只是给研发技术部门自己看得明白的一串型号名称。

而产品生产出来后就交给营销部门去做了,又给每一种CPU设计了一个型号名称。

[TOC]
2017.8.3

学习笔记
  • 世界上最遥远的距离不是生与死,而是学霸和学渣之间的数学题!
  • 大数据是什么?bigger than bigger,比逼格更逼格
  • stack-overflow

Python

https://www.zhihu.com/question/20751219

机器学习

1 Data Science Weekly 这是一个免费周刊,主要提供与数据科学有关的新闻策划、文章和工作。2 Data Tau一个简单实用的刊物,提供了一些外部资源的链接。3 The Yha有关机器学习、数据科学和工程的博客。4 The Data Science Handbook手册提供了25名经验丰富的数据科学家的建议与见解。分享来源:Udacity 官方 Career Resource Center

作者:优达学城(Udacity)
链接:https://www.zhihu.com/question/34444491/answer/146523789
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

Lunix

数据挖掘

  • 获取数据:网络爬虫 —–Python
  • 处理数据:思维导图 —–Xmind

作者:王其平
链接:https://www.zhihu.com/question/20751219/answer/70633058
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

推荐下面“清华大数据(微信号:Tsinghua_Big_Data)”的一篇文章“如何通过自学,成为数据挖掘“高手”。另外也可以参考知乎上的如何成为一名数据科学家? - 王其平的回答。标题:如何通过自学,成为数据挖掘“高手”基础篇:1. 读书《Introduction to Data Mining》,这本书很浅显易懂,没有复杂高深的公式,很合适入门的人。另外可以用这本书做参考《Data Mining : Concepts and Techniques》。第二本比较厚,也多了一些数据仓库方面的知识。如果对算法比较喜欢,可以再阅读《Introduction to Machine Learning》。2. 实现经典算法。有几个部分:a. 关联规则挖掘 (Apriori, FPTree, etc.)b. 分类 (C4.5, KNN, Logistic Regression, SVM, etc.)c. 聚类 (Kmeans, DBScan, Spectral Clustering, etc.)d. 降维 (PCA, LDA, etc.)e. 推荐系统 (基于内容的推荐,协同过滤,如矩阵分解等)然后在公开数据集上测试,看实现的效果。可以在下面的网站找到大量的公开数据集:UCI Machine Learning Repository3. 熟悉几个开源的工具: Weka (用于上手); LibSVM, scikit-learn, Shogun4. 到 Kaggle: The Home of Data Science 上参加几个101的比赛,学会如何将一个问题抽象成模型,并从原始数据中构建有效的特征 (Feature Engineering). 到这一步的话基本几个国内的大公司都会给你面试的机会。进阶篇:1. 读书,下面几部都是大部头,但学完进步非常大。a.《Pattern Recognition and Machine Learning》b.《The Elements of Statistical Learning》c.《Machine Learning: A Probabilistic Perspective》第一本比较偏Bayesian;第二本比较偏Frequentist;第三本在两者之间,但我觉得跟第一本差不多,不过加了不少新内容。当然除了这几本大而全的,还有很多介绍不同领域的书,例如《Boosting Foundations and Algorithms》,《Probabilistic Graphical Models Principles and Techniques》;以及理论一些的《Foundations of Machine Learning》,《Optimization for Machine Learning》等等。这些书的课后习题也非常有用,做了才会在自己写Paper的时候推公式。2. 读论文。包括几个相关会议:KDD,ICML,NIPS,IJCAI,AAAI,WWW,SIGIR,ICDM;以及几个相关的期刊:TKDD,TKDE,JMLR,PAMI等。跟踪新技术跟新的热点问题。当然,如果做相关research,这一步是必须的。例如我们组的风格就是上半年读Paper,暑假找问题,秋天做实验,春节左右写/投论文。3. 跟踪热点问题。例如最近几年的Recommendation System,Social Network,Behavior Targeting等等,很多公司的业务都会涉及这些方面。以及一些热点技术,例如现在很火的Deep Learning。4. 学习大规模并行计算的技术,例如MapReduce、MPI,GPU Computing。基本每个大公司都会用到这些技术,因为现实的数据量非常大,基本都是在计算集群上实现的。5. 参加实际的数据挖掘的竞赛,例如KDDCUP,或 Kaggle: The Home of Data Science 上面的竞赛。这个过程会训练你如何在一个短的时间内解决一个实际的问题,并熟悉整个数据挖掘项目的全过程。6. 参与一个开源项目,如上面提到的Shogun或scikit-learn还有Apache的Mahout,或为一些流行算法提供更加有效快速的实现,例如实现一个Map/Reduce平台下的SVM。这也是锻炼Coding的能力。到这一步国内的大公司基本是想哪去哪,而且待遇也不差;如果英语好,去US那边的公司难度也不大了。

图数据挖掘

作者:Eric Ye
链接:https://www.zhihu.com/question/63147698/answer/207851568
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

图数据可以挖掘的点有很多,从宏观层面来讲,主要包括网络的特征统计分析(比如,小世界,无标度,幂律分布);从中观层面来讲,主要包括社区发现以及最近比较新的motif的分析;从微观层面来讲,主要包括链路预测,结点排序,影响力最大化等。由于生活中很多东西都可以通过图结构来描述,对图的研究很多领域都有涉及,比如复杂网络领域、数据库领域、数据挖掘领域、IR领域、数学领域等。因为很多领域的人都研究图数据,所以关于图的很多问题确实被研究的比较透彻了。但是图数据挖掘仍然还有很多值得深入研究的问题,具体来讲:1.大规模网络社区发现算法 社区发现主要用于社交网络分析,微信、脸谱等用户规模都已经破亿,如何设计高效的算法来处理如此大规模的网络还有很大的研究空间。2.Network embedding 网络映射是最近比较热门的研究点。之前的谱聚类是先由数据特征构造图,然后基于构造的图来进行聚类分析。网络映射则恰恰相反,它是基于图结构为图中每个节点学习一个低维的表征向量。3.Multi-network 单一图的研究大家做得差不多了,就提出了多图的概念,目前这个点也有很大的发文章的空间。4.异构网络的分析处理 异构网络能够更真实的刻画实际情况,也能够保留更多的实际信息。对异构网络的研究目前主要是基于meta path,但我个人认为meta path应用场景限制比较大,所以这个点适合挖坑搞个大动作,如果能提出一种比meta path更好的更具通用性的方法,文章引用次数肯定会很高。5.网络中异常节点检测 社交网络中异常用户检测,比如营销账号,僵尸粉等。现在能够收集到更多的数据,所以可以结合收集的数据和用户的社交网络关系来做异常点检测。6.时态图分析 图是在不断变化的,如社交网络中新的好友关系的建立,如何从动态的角度来分析网络,如何修改已有算法使其适用于时态图等都值得深入研究。KDD SIGMOD VLDB WWW AAAI IJCAI ICDE这些顶会上每年都有很多关于图或者网络的文章。国内推荐关注清华唐杰,电子科大周涛,国外推荐关注斯坦福的Jure Leskovec。


2、关注名人、名博、网站,多渠道学习。
1) 关注专业的数据分析、咨询公司网站和论坛,特别强调,统计软件公司的网站如SPSS的官网有很多案例库,值得关注。
数据分析网:http://www.afenxi.com/中国统计网:http://www.itongji.cn/爱数据网:http://www.lovedata.cn/
SPSS的案例库,可在官网上搜索各类案例:http://www.ibm.com/developerworks/cn/data/library/techarticle/dm-1108zhangzy/index.html
另外,你最好建一个自己的网址导航目录,提升你的学习效率
2) 关注名人名博,最好能加他们的微博、微信和微信公众号,看牛人的博客和微信等内容,还是能得到很多引导,这个你懂的。
如沈浩老师的博客:http://shenhaolaoshi.blog.sohu.com/数据分析网公众号:afenxi_com数据海洋公众号:dataplayer“数聚”公众号:shuju_vip
3) 加入一些有共同爱好的QQ群,互相学习交流。通常群里有人会提出一些真实的运营问题,然后大家用不同的方法去解决,对思路很有启发。
4) 碎片化学习,最大化你的时间价值。为了把零散的时间利用起来,通常我会把一些资料上载到网盘,在零碎的时间里通过手机进行视频、文档学习等。目前使用百度云盘和360网盘。百度云盘应用比较广,通常在网络上搜索“关键词 百度云”后,搜到结果可以直接保存在云盘上,搜索保存速度极大提升。360网盘则空间比较大,可以到达40T,同时有保险箱加密功能,安全性高一些。
手机上安装一些APP,随时随地学习。

数据分析师

分析数据,需要用到各类的模型,包括关联规则、聚类、分类、预测模型等,其中一个最重要的思想是对比,任何的数据需要在参照系下进行对比,结论才有意义。
推荐的书籍:
1、《数据挖掘与数据化运营实战,思路、方法、技巧与应用》,卢辉著,机械出版社。这本书是近年国内写得最好的,务必把它当作圣经一样来读。
2、《谁说菜鸟不会数据分析(入门篇)》和《谁说菜鸟不会数据分析(工具篇)》,张文霖等编著。属于入门级的书,适合初学者。
3、《统计学》第五版,贾俊平等编著,中国人民大学出版社。比较好的一本统计学的书。
4、《数据挖掘导论》完整版,[美]Pang-Ning Tan等著,范明等翻译,人民邮电出版社。
5、《数据挖掘概念与技术》,Jiawei Han等著,范明等翻译,机械工业出版社。这本书相对难一些。
6、《市场研究定量分析方法与应用》,简明等编著,中国人民大学出版社。
7、《问卷统计分析实务—SPSS操作与应用》,吴明隆著,重庆大学出版社。在市场调查领域比较出名的一本书,对问卷调查数据分析讲解比较详细。

查漏补缺

点数据组其实可以看出n*2矩阵,即[[2,3],[3,2]] == [2,3;3,2]python中没有用分号分隔。
Python3.5中:iteritems变为items
axis=0表述列
axis=1表述行

k-近邻算法(kNN)

算法步骤

1)为了判断未知实例的类别,以所有已知类别的实例作为参照
2)选择参数K
3)计算未知实例与所有已知实例的距离
4)排序后选择最近K个已知实例
5)根据少数服从多数的投票法则(majority-voting),让未知实例归类为K个最邻近样本中最多数的类别

作者:Luau Lawrence

链接:https://www.zhihu.com/question/35992297/answer/67009652
来源:知乎
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。

PRML究竟有何过人之处,不能光看它本身的内容,最重要的是看其在Machine Learning, Data Mining这一类书籍中的地位。通常从一个CS小白开始学Machine Learning或者Data Mining,到成长为一个独当一面的大牛,都会看几种类型的书:以《数学之美》为代表的科普类读物。通常作用为开发兴趣的。《机器学习实战》、《推荐系统实践》、《海量数据挖掘》等实践类书籍。在学中用,在用中学,实践中摸清套路。顺便了解一些基本模型。《统计学习方法》、《数据挖掘导论》、《数据挖掘(韩家炜)》等介绍类书籍。会对ML方面涉及到的技术做一个浅层次的介绍和全方位的了解,有少量数学内容和推导。《PRML》、《ESL》、《MLAPP》这类进阶类书籍。包涵大量理论知识和数学推导(尤其是习题),有助于了解Machine Learning方法背后的本质和思想。Machine Learning学习的过程,就是一个 what -> how -> why 的过程。而PRML,或者说同类的ESL等书籍,最大的作用就是让你知道为什么会有这样的方法,为什么会有这样的模型,它背后的intuition和motivation是什么。而这恰恰是一个Machine Learning Researcher想要进一步使用模型、看懂别人paper中的模型、甚至自己提出新模型的基础。看PRML会带给你在Machine Learning上的理解和使用能力一个质的飞跃。而在同一层次上,比如PRML和ESL相比,我个人认为,PRML涵盖面更广,语言更通俗,例子和习题更加详细,附带更多基础性的讲解和指引(比如第二章整章都在介绍概率分布),难度梯度设置更为合理,是其深受广大中老年PHD朋友喜爱的原因。可以说,PRML是一本兼顾广度、深度、可读性、可用性(做习题)的好书。

20170823

C:\Users\某某某.keras tensorflow改为theano
Tensorflow、theano官网都明确说明暂不支持python3.6,建议使用Anaconda创建python3.5环境来测试。
老老实实pip install keke
在python3.6 下用pip3 install keras也没有问题呀,挺好装的。

问题

  • 坐标轴显示中文
  • 图例显示
  • tile函数:倒着看,tile(a,[2,3]) #第一维重复3遍,然后重复两遍
  • 导入文件数据 np.loadtxt

  • 注意K-means和kNN算法的区别
  • http://tools.antlm.com/
  • http://blog.csdn.net/linzch3/article/details/76038172?locationNum=9&fps=1
    数据处理时常用函数:strip、split、append、len、range、open、readlines、read、readline、
    encoding、type、shape、reshape
  • f和lf的区别
  • plt.rcParams[‘font.sans-serif’]=[‘SimHei’] #用来正常显示中文标签
  • plt.rcParams[‘axes.unicode_minus’]=False #用来正常显示负号

kernel核心
Titanic泰坦尼克号
get start入门
overview概述
leaderboard排行榜
tutorial教程
Frequently Asked Questions常见问题
maiden voyage首航期间
infamous shipwreck臭名昭着
ship船舶
sensational tragedy耸人听闻的悲剧
iceberg冰山
sink沉没
collid相撞
shipwreck
lifeboat救生艇
crew船员
gender性别
Variable Definition
cabin
Embarkation

.ix is deprecated. Please use.loc for label based indexing or.iloc for positional indexing

Braund, Mr. Owen Harris这是什么名字??

今年上半年,爱奇艺在头部版权内容布局上秉承开放创新的生态理念,并以差异化的题材、高品质的剧集作品始终领跑全网。此前,《人民的名义》《楚乔传》《欢乐颂》等大剧在爱奇艺平台播出,在强平台运营力全面加持下从流量到口碑受到了行业人与用户的高度肯定,其中爱奇艺《楚乔传》以破百亿的成绩成为今年炙手可热的顶级头部剧集。而在自制内容方面《河神》《盲侠大律师》《鬼吹灯之牧野诡事》等一系列精品自制剧,更是比肩“美剧”品质,广受权威媒体力赞,成为行业品质剧集的“范本”。此番,爱奇艺全网独播《轩辕剑之汉之云》取得的优秀口碑成绩,再次证明的爱奇艺强大的平台运营力与推动力。进入今年下半场,无论是头部版权剧集还是精品自制内容,爱奇艺将继续发挥强平台的运营力,通过差异化排播模式、多元化题材优势不断生产并吸收创新型头部内容,助推影视市场持续优化发展。

轩辕剑十八集完

看课程:https://www.coursera.org/
在线Code:http://www.codecademy.com/zh/
通过游戏code:http://codecombat.com/

LeetCode Online Judge,支持 Python,我也是以前看到的:Leetcode 编程训练 | 酷 壳 - CoolShell.cn

还有在 Github 上看到的一个,不过作者好像没有更新下去,现在有 24 个小题目:Show-Me-the-Code/show-me-the-code

用什么语言昵???
java、python、c++、c、c#、PHP、JS、VB.NET
还记得曾经在codeforces上的特别比赛吗?一场比赛中的题目解决语言不能重复。
leetcode
PythonTip
计蒜客
山东理工ACM主页
hdoj
neuqoj

http://www.ruanyifeng.com/blog/2017/02/fp-tutorial.html
函数式编程
腾讯课堂
C:\Users\Administrator\AppData\Roaming\npm\node_modules\hexo-cli\node_modules\hexo-util
https://coding.net/help/doc/pages/getting-started.html
https://pages.coding.net/
http://www.cnblogs.com/kidsitcn/p/4557548.html
http://blog.csdn.net/tonydandelion2014/article/details/61615898

http://blog.csdn.net/w0612w/article/details/50879922
http://blog.csdn.net/weixin_36401046/article/details/52940313
http://blog.csdn.net/wx_962464/article/details/44786929
http://blog.csdn.net/seven_2016/article/details/53587769

https://www.baidu.com/home/news/data/newspage?nid=21128381400542231&n_type=0&p_from=1&dtype=-1

缺失模块。
1、请确保node版本大于6.2
2、在博客根目录(注意不是yilia根目录)执行以下命令:
npm i hexo-generator-json-content –save

3、在根目录_config.yml里添加配置:
jsonContent:
meta: false
pages: false
posts:
title: true
date: true
path: true
text: false
raw: false
content: false
slug: false
updated: false
comments: false
link: false
permalink: false
excerpt: false
categories: false
tags: true

http://blog.csdn.net/melordljm/article/details/51985129
http://blog.csdn.net/xuezhisdc/article/details/53130383
https://cczeng.github.io/
CountDownLatch
markdown中加入#!可以显示行号

可以高亮显示

import sys
reload(sys)
sys.setdefaultencoding(‘gbk’)
解决中文问题
python定义的函数不调用不会执行
html5实现上传和下载功能失败!!!
河神全集完
轩辕剑22集完

天天美剧
美剧天堂
http://www.jianshu.com/p/f42fabdf9e8b
hexo的rss
http://blog.csdn.net/u011303443/article/details/52333695
http://blog.csdn.net/czfbxcg/article/details/50939999
http://jingyan.baidu.com/article/e52e3615aac99740c60c5129.html
http://www.cnblogs.com/moondark/p/3607825.html

走投无路,自杀。对面得不到钱,而且复活时间减半
自杀,周围队友加血,牺牲小我,完成大我的一种无私奉献的精神!

大学室友玩虐杀原形,对面寝室那个觉得有趣就一直看着。我室友问了他一句,画质还行吧?他呵呵一笑,我这游戏虐的你渣都不省。然后打开了dnf

在浏览器地址栏中输入网关地址回车之后即可打开连接到路由器的登录界面

配合一下Google BBR效果更佳:https://www.vultr.com/docs/how-to-deploy-google-bbr-on-centos-7

照片我没删,我只是加密了;东西我没丢,我把它们装进了那个大箱子里;而你,我也没忘,我把你整理好,放进了那些情歌里。

我爱你,就算你满嘴谎言,仍有我痴心不变。 我爱你,在我死了以后把我的骨灰带在身上,遇到坏人就扬出去,让我再保护你最后一次。 我爱你,为了寻找你,我搬进鸟的眼睛,经常盯着路过的风,也忘了听猎人的枪声。 我爱你,就算你一身污秽如刺猬,也有我双手拥抱不忌讳。 我爱你。好想学一种可以伴你一生的咒语,哪怕是做你的宠物狗也可以。 我爱你,如果我此生只能给你拥抱,和不放开你的手,你愿不愿意跟我走。 我爱你,如果有一天你觉得越相爱越是场意外那就请你悄悄在月光下找个男孩把我取代。 我爱你,你用半生温柔,相濡以沫陪我赌,我又怎么舍得让你输。 我爱你,找个机会把这三个字还给我吧。 我爱你,别为了不属于你的观众,演绎你不擅长的人生,反正谢幕后的每次相逢,都有我捧着鲜花,把你拥入怀中。 我爱你,又很遗憾没人证明。可这份爱已如鲸投海,如鸟投林。可这份爱已经无可避免,退无可退了。

大话西游之爱你一万年27集完
轩辕剑56集完
母亲曾患肺结核导致左肺坏死,至今左肺部分是用肺支架撑起,不宜劳动,常年吃药养病。家庭的唯一经济来源于父亲。

chrome打不开https
chrome打不开https
当亲密度满600时才会在loading时显示标志。