草根站长论坛's Archiver

xiangzi 发表于 2007-7-3 17:07

巧用Word把复制来的网页乱码转换清零

昨天上网,[url=http://www.it.com.cn/f/hotweb/056/9/127156.htm][color=#0000ff]偶遇[/color][/url]一篇美文,欲收藏之,但当我将其复制到文本文件中时,却发现每行的后面都有一些不规则的乱码,莫非这就是传说中的防复制乱码?怎么办?难道要一行一行的清理这些乱码?在一番摸索后,终于找到用Word快速清除乱码的方法。  问题分析:
b8F;HH `1N!p4d   在正常状态下看不见这些乱码,但只要选中了几行或整篇文字,这些乱码就会显露出来了。点右键查看网页的“源文件”,发现在每一行的后面都有一段乱码,并且其“font”标签中的“color”值都是一样的——“#FFFFFF”(白色)。白色的乱码,在网页背景是白色的情况下当然看不到了。
n_H_ X2{u+p5N/U   看来要解决乱码,只有从复制后的文字入手,但这些乱码的值及长度又没有规则,如何将其替换为空呢?
"}-w0WcnW8}   问题解决:
7N$aNAU   说到“替换”,我忽然想起了Word,其“替换”功能中好像有一项“字体”替换,前面的乱码虽然在长度上没有规则,但其颜色却都是一样的,这不也是一种关键字吗? ^;LRo I2b~Z
  启动Word,将复制的文字粘贴到空白文档中,在默认状态下,Word是按源文件的格式进行显示的,所以这段文字在Word中和在网页中看到的效果是一样的,乱码隐藏在白色背景中。-c9_cj1h
  接下来点击菜单“编辑”中的“替换”,在打开的“查找和替换”窗口中点击“高级”,展开替换的高级功能,接着点击“格式”下的“字体…”,在打开的“字体”窗口中,点击“全部文字”中的“字体颜色”内的“下拉菜单”,选择其中的“白色”(图1)
RC Ue2~|]6c*N G [img]http://www.it.com.cn/f/edu/072/26/070226_gzl_bg_01.jpg[/img]  注:有些网页中的防复制代码的颜色不是白色,比如是:#FCFCFC,对这种不在常规中显示的颜色,我们就要采取自定义的方式,选择“其他颜色”窗口中的“自定义”面板,将其中的“红色”、“绿色”、“蓝色”分别设为“#FCFCFC”中所对应的十进制数值。tY*`v!dUs7u$`
  怎么将十六进制FC转为十进制数值呢?用WINDOWS的计算器吧,使用其的“科学型”方式,就可以将一个数值转为在十六、十、八、二进制数值,比如前面的十六进制FC,转为十进制就是252。
?\G"P Oo7B+C[   设置完字体颜色,点“确定”返回到“查找和替换窗口”(图2)
D6S(M%C*{ EgI#f8C [img]http://www.it.com.cn/f/edu/072/26/070226_gzl_bg_02.jpg[/img]  在“查找内容”中虽然没有内容,但其下的格式却给出了当前查找的关键字是字体颜色为“白色”的内容,接下来是“替换为”的设置,因为我们要将这些乱码替换为空,所以在“替换为”中什么也不用输入,直接点击“全部替换”就可以了,待替换完成后查看一下效果,无论是更改Word的背景颜色,还是将这些文字复制到文本文件中,均看不到乱码的踪迹了。

页: [1]

Powered by 草根站长网 © 2007-2008