老Y文章管理系统采集自动伪原创详解
2019-03-15 09:48:47来源: freeqian.org.ru 阅读 ()
做垃圾站的站长们,最希望的事就是网站可以自动采集、自动完成伪原创、然后自动收钱,这实在是天底下最幸福的事,呵呵。自动采集和自动收钱就不讨论了,我今天介绍一下如何利用老Y文章管理系统采集时自动完成伪原创的方法。
老Y文章管理系统使用简单、方便,虽然功能不如DEDE之类的强大到几乎变态的程度(当然,老Y文章管理系统是asp语言写的,似乎也没有可比性),但是该有的都有,且相当简单,所以也受到了不少站长们的欢迎。老Y文章管理系统采集时自动完成伪原创的具体方法还很少有人探讨,在老Y的论坛上,甚至有人在卖这个方法,小小的鄙视一下。
关于采集,我就不多说了,相信大家都可以搞定,我要介绍的是老Y文章管理系统如何在采集的同时自动完成伪原创工作的具体方法,大体的思路就是利用老Y文章管理系统自带的过滤功能实现近义词的自动替换,从而达到伪原创的目的。比如我想将被采集文章中的所有“网赚博客”字样替换为“网赚日记”。详细步骤如下:
第一步,进入后台。找到“采集管理”-“过滤管理”,添加一个新的过滤项目。
我可以建立一个名为“网赚博客”的项目,具体设置请看图:
“过滤名称”:填入“网赚博客”即可,也可以随意写,但是为了方便查看,建议与被替换的词语一致。
“所属项目”:请根据自己的网站进行选择一个网站栏目(必须选择一个栏目,否则过滤项目无法保存)
“过滤对象”:可选项有“标题过滤”和“正文过滤”,一般选“正文过滤”即可,如果你连标题都想伪原创一下,可以选择“标题过滤”。
“过滤类型”:可选项有“简单替换”和“高级过滤”,一般选“简单替换”,如果选择了“高级过滤”,需要指定“开始标记”和“结束标记”,这样可对采集来的内容进行代码级的替换。
“使用状态”:可选项有“启用”和“禁用”,不用解释。
“使用范围”:可选项有“公有”和“私有”。选择“私有”,该过滤仅对当前网站栏目有效;选择“公有”,对所有栏目都有效,不管采集任何栏目的任何内容,该过滤均有效。一般选“私有”即可。
“内容”:填入“网赚博客”,将要被替换的词语。
“替换”:填入“网赚日记”,这样只要被采集的文章中含有“网赚博客”字样,就会被自动替换为“网赚日记”。
第二步,重复第一步的工作,直到添加完所有的近义词。
有网友要问了:我有30000多条近义词,难道要一条一条手动添加?那要到添加什么时候!?不能批量添加吗?
这个问题问得好!手动添加的确几乎是个不可能完成的任务,除非你有超常的毅力,可以手工把这30000多条近义词添加进去。遗憾的是,老Y文章管理系统并没有提供批量导入的功能。但是,作为真正的、资深的、有思想的懒人,我们要有懒人的觉悟。
要知道,我们刚才输入的内容,是存储在数据库中的,而老Y文章管理系统是用asp+Access写的,mdb数据库可以很方便的编辑!于是乎,我可以通过直接修改数据库的方法来批量导入伪原创替换规则!
改进的第二步:修改数据库,批量导入规则。
经过查找,我发现这个数据库位于“你的管理目录\cai\Database”下。用Access打开这个数据库,找到“Filters”表,你会发现我们刚才添加的替换规则就在这儿存着呢,根据你的需要,批量添加吧!接下来的工作涉及到Access的操作了,我就不罗嗦了,大家自己可以搞定。
解释一下“Filters”表中的几个字段的含义:
FilterID:自动生成,无需输入。
ItemID:栏目ID,就是我们手动输入时“所属项目”的内容,不过这里是个数字ID,注意跟栏目的采集ID做好对应,如果不知道ID,可以重复第一步,测试一下。
FilterName:即“过滤名称”。
FilterObjece:即“过滤对象”,填1为“标题过滤”,填2则是“正文过滤”。
FilterType:即“过滤类型”,填1为“简单替换”,填2为“高级过滤”。
FilterContent:即“内容”。
FisString:即“开始标记”,仅在设置了“高级过滤”时有效,如果设置了“简单过滤”请留空。
FioString:即“结束标记”,仅在设置了“高级过滤”时有效,如果设置了“简单过滤”请留空。
FilterRep:即“替换”。
Flag:即“使用状态”,TRUE为“启用”,FALSE为“禁用”。
PublicTf:即“使用范围”。TRUE为“公有”,FALSE为“私有”。
最后说一点利用过滤功能实现伪原创的使用感受:
老Y文章管理系统的这个功能可以实现采集时自动伪原创,但是功能还不够强大。比如我站上有“栏目一”、“栏目二”、“栏目三”共三个栏目。我希望“栏目一”对标题和正文都进行伪原创,“栏目二”只对正文进行伪原创,“栏目三”只对标题进行伪原创。
于是,我只能做如下设置(假设我有30000的近义词规则):
为“栏目一”的标题伪原创创建30000条替换规则;
为“栏目一”的正文伪原创创建30000条替换规则;
为“栏目二”的正文伪原创创建30000条替换规则;
为“栏目三”的标题伪原创创建30000条替换规则。
这样就造成了极大的数据库浪费,如果我的站有几十个栏目,每个栏目的要求都不一样,这个数据库的尺寸将会十分恐怖。
所以建议老Y文章管理系统下一版本将这个功能做一下改进:
首先添加批量导入功能,毕竟修改数据库有一定的危险性。
其次,过滤规则不再依附于某个网站栏目,而是将过滤规则独立出来,而在建立新的采集项目的时候,加入一条是否使用过滤规则的判断。
相信,这样修改之后可以极大地节约数据库存储空间,同时逻辑结构也显得更加清晰。
本文为“我的网赚日记-原创网赚博客”原创,请尊重我的劳动成果,转载请注明出处!另外,我使用老Y文章管理系统时间并不是很久,如果文中有错误或不当的地方,欢迎大家指正!
标签:
版权申明:本站文章部分自网络,如有侵权,请联系:west999com@outlook.com
特别注意:本站所有转载文章言论不代表本站观点,本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有
- 优惠券发放策略设计 2019-07-18
- 一篇文章涨粉20万!千万量级爆文频出,公众号内容红利正当时 2019-07-15
- 运营的前世今生,未来运营会变成什么样? 2019-05-08
- 如何提升公众号关注率,让用户看完文章关注你 2019-04-10
- 做公众号没方向?看懂这4种类型文章,不用慌! 2019-04-10
IDC资讯: 主机资讯 注册资讯 托管资讯 vps资讯 网站建设
网站运营: 建站经验 策划盈利 搜索优化 网站推广 免费资源
网络编程: Asp.Net编程 Asp编程 Php编程 Xml编程 Access Mssql Mysql 其它
服务器技术: Web服务器 Ftp服务器 Mail服务器 Dns服务器 安全防护
软件技巧: 其它软件 Word Excel Powerpoint Ghost Vista QQ空间 QQ FlashGet 迅雷
网页制作: FrontPages Dreamweaver Javascript css photoshop fireworks Flash