更新说明:
, [+ u3 n T& x& s1 O) d
V2.1 Build 0423 释放时间:08.04.23 10:18
' d# M& k0 m' _% a9 p9 }
1、完善
数据库直导功能,修正导库内容中有单引号之类导致mysql
数据库拒绝入库缺陷,
程序自动处理保障完整导库。
9 D3 s$ c; A8 ^5 B3 c+ _" ?
2 S) R, N- _4 M) {9 ^; |
适用范围:
5 F) b* T+ ?- A6 P. \+ z
1、部署环境不限,Windows、Linux、FreeBSD、Solaris等凡是可以安装PHP语言支持环境的
系统均可以;
n, N. ~/ f; {, |+ \2、采集目标不限,静态HTML、动态PHP/
ASP/JAVA页面都可采集;
1 L, X6 \- i6 c
3、采集对象支持:文章、图片、Flash;
+ T1 B* ?* O4 f: J+ d4 M4、完美的内容入库解决方案,小蜜蜂采集器提供2种入库方式:数据库直导和模拟提交。
( U% T2 H2 D+ \: G7 o. |& }* p9 q
1)数据库直导完美支持任何基于Mysql数据库存储信息的内容
管理系统,包括多表/多字段联动系统导库,
: K, w0 U! j, N" Z* [2 E- } 支持直导规则追加自定义
SQL语句,可实现更高级的导库后内容构造,比如对导库后特定内容使用
SQL语句再加工这样的高级应用。
3 J+ q b- f) o7 o2 g, } 2)模拟提交导库理论上支持任何目标,不受目标程序语言、数据库类别限制;实际使用效果受目标应用程序影响。
" I9 P# e6 z V' o
1 b: w0 c7 v/ U' J% C, |各采集模块功能简介:
V* J: I& {/ }$ S1 D( I
1、 文章采集模块 专门采集文章/图片,也可采集文章中附带的Flash,但是功能不如Flash采集模块强大;
7 x& q0 Q4 O; K4 Q
2、 BBS
论坛采集模块 专门采集BBS
论坛内容;
. ^' B( b+ w/ J9 ~( `3、 Flash采集模块 专门采集Flash小
游戏,可完美采集缩略图、
游戏简介;
3 a8 L4 c$ a( i7 V& j. t8 `( q
" A8 D+ c0 q1 H) x5 W7 S( i采集内容导库简介:各模块采集的内容均可自由导入WEB应用系统。
/ P5 L) N$ T3 z, Z G% c
+ l+ Z& r J7 F9 P C! R" G! G9 l功能介绍:
- a) g2 j9 D/ @4 Q8 x
1、支持文章内容分页采集;
! o; F( k/ M( D: \2、支持论坛采集
) C9 @) ^+ J4 J! J4 L5 c) v' I# M3、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标;
9 s" G$ L% {1 \( O4、支持把文章内容保存到本地;
) B4 L5 t F4 r7 B+ ^
5、支持站点+栏目管理方式,使采集管理一目了然;
6 C& @8 w; y- A4 D) p8 @
6、支持
链接替换、分页
链接替换,破解某些使用JS/后台程序设置的防采功能;
" ~6 t8 w* A" T: f# \7、支持采集器设置无限过滤功能;
7 ~; y. U0 D; o4 L
8、支持图片采集保存到本地,自动替换文件名避免重复;
5 i- k+ J0 ^/ V. Q9、支持FLASH文件采集保存到本地,自动替换文件名避免重复;
1 R6 R/ H( v1 u$ w& y+ t% V' K; s10、支持限制PHP FOPEN、FSOCKET函数功能的
虚拟主机;
* a, x7 S9 @' L p: j0 A& {3 L/ m
11、支持采集结果人工筛选,并提供“空标题、空内容”的快速过滤删除;
9 Z6 w9 l$ V* w, ^' ?" {12、支持Flash专业站采集,专门采集flash小游戏,可完美采集缩略图、游戏简介;
# V$ s. ^9 \0 i) ]( C7 ?+ u13、支持全站配置规则导入、导出;
% @+ U& r8 @% E! S- z+ W14、支持栏目配置规则导入、导出,提供规则复制功能简化设置;
v8 E) s# ^3 H/ Z2 C7 R
15、提供导库规则导入、导出;
3 C( } _5 e, Q. Q" S0 C16、支持自定义采集间隔时间,避免被误认为DDOS攻击而拒绝响应,可采集设置了防DDOS攻击的
网站;
C8 ]0 V4 ?! B% e% l17、支持自定义入库间隔时间,躲避虚拟主机并发数限制;
2 o: E8 m8 }; L1 j
18、支持自定义内容写入,用户可设置任意内容(如自己的链接、
广告代码),写入到所采集内容的:最前面、最后面,或者随机写入;导库时自动带上需要写入的内容,无需修改您WEB系统的模版。
* X1 f2 R. h3 }; N7 N19、支持采集内容替换功能,用户可设置替换规则随意替换;
& ?7 G4 ]9 V0 n5 r6 f20、支持html标签过滤,允许采集到的内容仅保留必要的html标签甚至无任何html标签的纯文本。若系统默认的标签不满足您的需要,还可以自定义其他HTML标签提升采集性能;
6 i: A( C" ?" }21、支持多种CMS导库 如:小蜜蜂商务门户网站系统(BBWPS)、DedeCms(织梦)、PHP168、mephpcms、Mambo、Joomla、多讯(DuoXun)、SupeSite、Cmsware、帝国ECMS、新雨动网(XYDW)CMS、动易CMS、风讯CMS、HUGESKY CMS、PHPCMS系统导库;
* I. z! `( j* d! p0 X/ B) }22、支持PHPWIND、
Discuz、BBSxp论坛导库;
$ Z+ h, t8 o! T7 [! M& g! O* n23、支持WordPress、Bo_Blog日志系统导库,除了官方提供导库规则以外,您也可以自己设计所用系统的导库规则,导库设计功能完全开放;
~- |/ g2 V4 z" N) {( j24、附带数据库优化工具,减少频繁采集数据碎片过多降低数据库性能。
5 O: I- L) x* h5 [2 o2 I, G( F
8 D8 O2 k$ ]8 t% X- {9 ^5 _) s- C- F以下特殊功能仅“小蜜蜂采集器”拥有:
! s, G7 F8 r1 Q# L0 D1、支持采集过程断点续采功能,不受浏览器意外关闭影响,重新启动后不会重复采集;
3 y! K" Y; }* }5 Z7 p
2、支持自动对比过滤功能,对已采集的链接系统不会进行重复采集和入库;
5 n& r: X. T t$ L, Z, r0 j
以上两条功能可大幅度减少采集时间,降低系统负载。
2 Y% {4 X! o( t" O2 Y
3、支持系统每日自动创建图片保存目录,方便管理;
; R8 _( v# M1 o1 x6 A* [( S3 z' U+ A. w4、支持采集/导库间隔时间设置,避免被目标站识别为
流量攻击而拒绝响应;
# l) @+ i/ ?4 W6 u# |4 t" A8 A5、支持自定义内容写入,达到简单防采功能;
4 ]9 A6 ]$ y5 T2 r" b+ Q3 S
6、支持html标签过滤,近乎完美的显示您想要的采集效果;
3 w% P' O8 X6 g
7、完美的内容入库解决方案,不受目标程序语言、数据库类别限制。
: e/ A% e x2 I
2 c _7 U' Q; B8 L0 v; ]4 Y# {以上众多强劲功能给您免费使用,即刻安装使用体验信息采集的轻松、高效。
; M; `; H& [$ T5 p9 t
-----------------------------
" _- k0 R, |+ Y: k; y+ Q* X单点
下载:
http://www.bbwps.com/down/beecollector.7z g1 z: K. {! N$ P. i
- M4 ^4 C7 S1 G3 e; k2 `
7Z后缀压缩文件解压工具:
http://www.7-zip.org/zh-cn/, U: S# x4 z: [$ g+ W5 A2 `' }( E
; v5 |! H. Z, w
多点下载:
http://www.downreg.com/down/?f-soft--id-11626.html; M" K. w- ]. t4 `( A `
/ @6 O K: w4 }& \/ V q1 S: b1 T3 XWindows支持环境(集成Apache/php/mysql,本地测试推荐使用):
3 w: H: T; s4 E/ zhttp://bbs.bbwps.com/thread-6265-1-1.html