Python 中使用 MongoDB 存储爬虫数据

2018-07-20    来源:open-open

容器云强势上线!快速搭建集群,上万Linux镜像随意使用

现在在做一个简单的搜索引擎,使用今日头条的新闻数据作为数据源。这些数据都是非结构性的,比较适合用 MongoDB 来进行存储。

以下为简单使用的示例。

#!/usr/bin/python
# -*- coding:utf-8 -*-

import pymongo

class documentManager(object):
    def __init__(self):
        pass

    def connect_mongo(self):
        client = pymongo.Connection("127.0.0.1",27017)
        db = client.data_db
        collection = db.data_collection
        mydict = {"name":"Lucy", "sex":"female","job":"nurse"}
        collection.insert(mydict)

        for i in collection.find({"name":"Lucy"}):
            print i

if __name__ == '__main__':
    manager = documentManager()
    manager.connect_mongo()

来自:http://my.oschina.net/lvyi/blog/599719

标签: 搜索 搜索引擎

版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点!
本站所提供的图片等素材,版权归原作者所有,如需使用,请与原作者联系。

上一篇:java Android 检查当前是否已经连接上 Internet

下一篇:java 使用 Common IO 包的 FileUtils 将文件大小转成适合阅读的格式