• Scrapy中的POST请求发送和递归爬取

    POST请求发送 重写爬虫应用文件中继承Spider类的 类的里面的start_requests(self)这个方法 def start_requests(self): # 请求的url post_url = ' http://fanyi.baidu.com/sug ' # post请求参数 formdata = { ' kw ' : ' wolf ' , } # 发送post请求 yield scrapy.Form...

    2019-01-16 05:50:07

  • Django 自定义模型管理器类2个应用场景

    class BookManager(models.Manager): # 改变查询集的结果集 def all(self): books = super().all() # QuerySet books = books.filter(isDelete= False) return books # 封装函数:操作模型类对应的数据表(增删改查) def create_book(self, title, author): # book =...

    2019-01-16 05:50:07

  • python3.x pool.map方法的实质

    我使用多进程的一般方式,都是multiprocessing模块中的Pool.map()方法。下面写一个简单的示例和解析。至于此种方法使用多进程的效率问题,还希望大佬予以指正。 示例: """ 探索pool.map多进程执行方式的实质 """ from multiprocessing import Pool from time import s...

    2019-01-16 05:50:05

  • logging模块

    一 日志级别: CRITICAL = 50 #FATAL = CRITICALERROR = 40WARNING = 30 #WARN = WARNINGINFO = 20DEBUG = 10NOTSET = 0 #不设置 二 默认级别为warning,默认打印到终端: import logginglogging.debug('调试debug')logging.info('消息info')logging.warning('警告warn...

    2019-01-16 05:50:05

  • Django中重定向页面的时候使用命名空间

    urls.py from django.urls import pathfrom . import viewsapp_name='front'urlpatterns = [ path('',views.index,name='index'), path('signin/',views.login,name='login')]''' path('signin/',views.login,name='login') 定义一个name 在views中跳转的时候可以使用r...

    2019-01-16 05:50:04

  • <5>Python的uwsgi web服务器

    一、是什么? uWSGI 是 web 服务器,用来部署线上 web 应用到生产环境。 uWSGI 实现了 WSGI 协议、 uwsgi 协议、 http 协议 。 WSGI(Web Server Gateway Interface) 是一种 web 服务器网关接口。它是一个 web 服务器与 web 应用通信的一种规范 WSGI 是一种通信协议,不...

    2019-01-15 07:06:15

  • <4>Python切片功能剖析

    引用文章: https://mp.weixin.qq.com/s/NZ371nKs_WXdYPCPiryocw 切片基础法则: ( 1 )公式 [i : n : m] , i 为起始位置索引 ( 当 i 为 首位 0 可省略 ) , i+n 为结束位置索引 ( 当 n 为 长度 len(li) 可省略 ) , m 为步长,默认 1 ,禁止 0 。 ( 2 ) i, n 同号...

    2019-01-15 07:06:13

  • 使用django 中间件在所有请求前执行功能

    django中间是一个轻级,低耦合的插件,用来改变全局的输入和输出。 一 如何使用中间件 定义中间件 注册中间件 # 这是一个中间件代码片段的说明,在各个位置的代码将在何时执行def simple_middleware(get_response): # One - time configuration and initialization. de...

    2019-01-15 07:06:12

  • Django使用网站图标

    默认情况下,浏览器访问一个网站的时候,同时还会向服务器请求“/favicon.ico”这个URL,目的是获取网站的图标。 若是没有配置的话,Django就会返回一个404错误,并且浏览器接收到这个404错误后不会显示出来。使用需要生成一个ico文件。 可以在http://www.bitbug.net/...

    2019-01-15 07:06:11

  • 使用selenium和phantomJS浏览器获取网页内容的小演示

    # 使用selenium和phantomJS浏览器获取网页内容的小演示 # 导入包 from selenium import webdriver # 使用selenium库里的webdriver方法调用PhantomJS浏览器实例一个浏览器的操作对象 # 括号里的参数为PhantomJS浏览器在电脑里的绝对路径,这里已经添加了环境变量,所以...

    2019-01-15 07:06:09

2