草根站长论坛's Archiver

笑问天 发表于 2008-4-23 14:00

小蜜蜂采集器 V2.1 Build 0423

更新说明:
@,Al uS\ V2.1 Build 0423 释放时间:08.04.23 10:189G/rd_?Q0nv
1、完善数据库直导功能,修正导库内容中有单引号之类导致mysql数据库拒绝入库缺陷,程序自动处理保障完整导库。:boIJNWsc

0Tx4d3^%U^@ 适用范围:sVO3C `
1、部署环境不限,Windows、Linux、FreeBSD、Solaris等凡是可以安装PHP语言支持环境的系统均可以;Z/\3]U;w3I2ot8?W p
2、采集目标不限,静态HTML、动态PHP/ASP/JAVA页面都可采集;)NN#ij'OY
3、采集对象支持:文章、图片、Flash; ]!~A)GP&iSU M s.u
4、完美的内容入库解决方案,小蜜蜂采集器提供2种入库方式:数据库直导和模拟提交。'w.u5h)s5H:|5j3SQ7V
         1)数据库直导完美支持任何基于Mysql数据库存储信息的内容管理系统,包括多表/多字段联动系统导库,
P.|MS`z.`3i             支持直导规则追加自定义SQL语句,可实现更高级的导库后内容构造,比如对导库后特定内容使用SQL语句再加工这样的高级应用。S\0KV&W
         2)模拟提交导库理论上支持任何目标,不受目标程序语言、数据库类别限制;实际使用效果受目标应用程序影响。
6~fC0q0[          k-kHh,R5tF
各采集模块功能简介:;j+v*J~|9u1\*zH*qVi
1、        文章采集模块 专门采集文章/图片,也可采集文章中附带的Flash,但是功能不如Flash采集模块强大;-b(f&?-hD`oR
2、        BBS论坛采集模块  专门采集BBS论坛内容;g5LQtp-lT(m
3、        Flash采集模块 专门采集Flash小游戏,可完美采集缩略图、游戏简介;N[%Kwe

!lF D,s$B%r 采集内容导库简介:各模块采集的内容均可自由导入WEB应用系统。
D6^U3ml_%?hF"W(D
^3AuG|k:Mc 功能介绍:     
UJQ }s7~TE 1、支持文章内容分页采集;:? h~(F)Y9j&d
2、支持论坛采集
&^GU1H;K R(pX+x 3、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标;
XqG1q*T d 4、支持把文章内容保存到本地;
T*G0X Y6QN IWg 5、支持站点+栏目管理方式,使采集管理一目了然;
^3Rk+P#zo 6、支持链接替换、分页链接替换,破解某些使用JS/后台程序设置的防采功能;7P)|6f0iwC5w
7、支持采集器设置无限过滤功能;
.ve!y+ny#Y2ie5h 8、支持图片采集保存到本地,自动替换文件名避免重复;
L!X/FN0W(t 9、支持FLASH文件采集保存到本地,自动替换文件名避免重复;E7DE7Hs+mzn
10、支持限制PHP FOPEN、FSOCKET函数功能的虚拟主机;/n/I2S+_0@/|f
11、支持采集结果人工筛选,并提供“空标题、空内容”的快速过滤删除;9E+M,E6lc8OcZ
12、支持Flash专业站采集,专门采集flash小游戏,可完美采集缩略图、游戏简介;(WQLY([$`1lR:_
13、支持全站配置规则导入、导出;
? E&H[Y1s ?'r$Xt 14、支持栏目配置规则导入、导出,提供规则复制功能简化设置;
eyB2p]D a 15、提供导库规则导入、导出;
(Q%LQ"?CSd d 16、支持自定义采集间隔时间,避免被误认为DDOS攻击而拒绝响应,可采集设置了防DDOS攻击的网站;{ {F/hk
17、支持自定义入库间隔时间,躲避虚拟主机并发数限制;&ejh2a*V'iv
18、支持自定义内容写入,用户可设置任意内容(如自己的链接、广告代码),写入到所采集内容的:最前面、最后面,或者随机写入;导库时自动带上需要写入的内容,无需修改您WEB系统的模版。m%M+C&Ct ws
19、支持采集内容替换功能,用户可设置替换规则随意替换;$jMO%bM1l
20、支持html标签过滤,允许采集到的内容仅保留必要的html标签甚至无任何html标签的纯文本。若系统默认的标签不满足您的需要,还可以自定义其他HTML标签提升采集性能;:mb]\ud(P H
21、支持多种CMS导库 如:小蜜蜂商务门户网站系统(BBWPS)、DedeCms(织梦)、PHP168、mephpcms、Mambo、Joomla、多讯(DuoXun)、SupeSite、Cmsware、帝国ECMS、新雨动网(XYDW)CMS、动易CMS、风讯CMS、HUGESKY CMS、PHPCMS系统导库;
N4x*Z\$YB 22、支持PHPWIND、Discuz、BBSxp论坛导库; Cj~ |H
23、支持WordPress、Bo_Blog日志系统导库,除了官方提供导库规则以外,您也可以自己设计所用系统的导库规则,导库设计功能完全开放;#~-u$e2]4VB+Q
24、附带数据库优化工具,减少频繁采集数据碎片过多降低数据库性能。{E*dM(J"FjH
`R @dYK
以下特殊功能仅“小蜜蜂采集器”拥有:
rl5V2X N nfd3Dh 1、支持采集过程断点续采功能,不受浏览器意外关闭影响,重新启动后不会重复采集;
o r v1E*~(Eg 2、支持自动对比过滤功能,对已采集的链接系统不会进行重复采集和入库; d+Ibs#X#vS/|Z
  以上两条功能可大幅度减少采集时间,降低系统负载。
;Jah[V!n!] 3、支持系统每日自动创建图片保存目录,方便管理;
!w'ATU%cF-f"x? 4、支持采集/导库间隔时间设置,避免被目标站识别为流量攻击而拒绝响应;?/wm1I(@ DrEI
5、支持自定义内容写入,达到简单防采功能;
hoQUC:d$a+A D 6、支持html标签过滤,近乎完美的显示您想要的采集效果;sn#A{)r i l8}y
7、完美的内容入库解决方案,不受目标程序语言、数据库类别限制。
#|#WZSa ~(T#N :Z6y gj5^N+E1o
以上众多强劲功能给您免费使用,即刻安装使用体验信息采集的轻松、高效。
QwZ9o4F.v+U9Wo -----------------------------
:C4g{ g/j}'fQ 单点下载:[url=http://www.bbwps.com/down/beecollector.7z][color=#0000ff]http://www.bbwps.com/down/beecollector.7z[/color][/url]
T!ZF:u8Z k'Q0?
1^)xi#U._1C2N*g-KQ 7Z后缀压缩文件解压工具:[url=http://www.7-zip.org/zh-cn/][color=#0000ff]http://www.7-zip.org/zh-cn/[/color][/url],J[~Hj gS9L7N

F \b6w;S#@(^ w 多点下载:[url=http://www.downreg.com/down/?f-soft--id-11626.html][color=#0000ff]http://www.downreg.com/down/?f-soft--id-11626.html[/color][/url]
2_V%}'r'W'z.u({
[s'y8h)nk{ [ Windows支持环境(集成Apache/php/mysql,本地测试推荐使用):
(pO3_8}D:XP"nb0I [url=http://bbs.bbwps.com/thread-6265-1-1.html][color=#0000ff]http://bbs.bbwps.com/thread-6265-1-1.html[/color][/url]

页: [1]

Powered by Discuz! Archiver 6.1.0  © 2001-2007 Comsenz Inc.