• haystack+Elasticsearch搜素引擎

    搜索引擎原理 通过搜索引擎进行数据查询时,搜索引擎并不是直接在数据库中进行查询,而是搜索引擎会对数据库中的数据进行一遍预处理,单独建立起一份索引结构数据。 我们可以将索引结构数据想象成是字典书籍的索引检索页,里面包含了关键词与词条的对应关系,并记录词...

    2018-07-17 04:05:56

  • 爬取动态网页时遇到的问题

    准备爬取太平洋网上的小米手机的评论,因为发现评论已经自动打好标签了,并且对于手机的几种性能表现也打了分,以及详细的评论都有,对于后面自己的工作有帮助,所以就准备爬取这些评论.但发现这个网站的每次点下一页都是相同的URL地址,也就是说源代码只显示第一页的...

    2018-07-17 04:05:56

  • Python爬虫之网页图片抓取

    一、引入 这段时间一直在学习Python的东西,以前就听说Python爬虫多厉害,正好现在学到这里,跟着小甲鱼的Python视频写了一个爬虫程序,能实现简单的网页图片下载。 二、代码 __author__ = "JentZhang"import urllib.requestimport osimport randomimport redef url_op...

    2018-07-17 04:05:54

  • 【python基础】之字符编码

    一、何谓编码 编码:将机器语言01翻译成人类能理解的语言;相关字符串与二进制对应关系图称之为ASCII表 二、编码发展简述 assic【英文编码表】 -- unicode【后各国均发展自己的编码表,导致编码表混乱,推出万国码unicode】 --utf-8 【但unicode存一个字符,统一占用2...

    2018-07-17 04:05:55

  • Python模块学习——tempfile

    主要有以下几个函数: tempfile.TemporaryFile 如何你的应用程序需要一个临时文件来存储数据,但不需要同其他程序共享,那么用TemporaryFile函数创建临时文件是最好的选择。其他的应用程序是无法找到或打开这个文件的,因为它并没有引用文件系统表。用这个函数创建的临...

    2018-07-17 04:05:54

  • pythonday2

    1. while循环: while 条件: 代码块(循环体) num=1 while num=5 : print (num) num +=1 break:结束循环;停止当前本层循环 continue:结束本次循环,继续下次循环 2. 格式化输出: 符号:+ 连接左右字符, %s 表示字符串占位符,可以放置任何内容 %d 数字占位符,只能放置数字...

    2018-07-16 02:51:12

  • pythonday4

    一,列表 1.1 列表的介绍 列表是python的基础数据类型之一 ,其他编程语?言也有类似的数据类型. 比如JS中的数 组, java中的数组等等. 它是以[ ]括起来, 每个元素用' , '隔开而且可以存放各种数据类型: lst = [1, ' 哈哈 ' , " 吼吼 " , [1,8,0, " 百度 " ], ( " 我 " , "...

    2018-07-16 02:51:10

  • pythonday3

    一,编码 1.最早计算机编码为ASCII,美国人创造的,128个码位,2**7,在此基础上加了一位,2**8,包含英文字母(大小写),数字,标点等特殊字符,首位0 一个ASCII码为8位,一个字节. 2.GBK 国标码,16位,2个字节(双字节字符) 3.unicod 万国码, ucs-2 16位,2个字节; ucs-4 32位,4个字...

    2018-07-16 02:51:08

  • pythonday6

    一,is和==的区别: 1, 通过一个ID()可以查看到一个变量表示的值在内存中的地址. s = ' alex ' print (id(s)) # 4326667072 s = " alex " print (id(s)) # 4326667072 lst = [1, 2, 4 ] print (id(lst)) # 4326685768 lst1 = [1, 2, 4 ] print (id(lst1)) # 4326684360 #...

    2018-07-16 02:51:06

  • python timeit模块

    在python,我们有时候需要考虑到自己设计的算法的复杂度,首先在python中提供了一个内置的模块,可以用来检验我们算法的复杂度,接下来来看下这个模块timeit的使用,首先我们导入模块from timeit import Timer,接下来我们需要将我们的苏需要的计算的模块进行封装成函数...

    2018-07-16 02:51:05

2