本篇文章给大家谈谈小说 api接口,以及网络小说平台api接口对应的知识点,希望对各位有所帮助,不要忘了收藏本站喔。
今天给各位分享小说 api接口的知识,其中也会对网络小说平台api接口进行解释,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在开始吧!
本文目录一览:
就是男主好像玩着游戏,就穿越变成游戏中的大雄,游戏里的大雄妈妈智
应用程序接口(API:applicationprogramminginterface)是一组定义、程序及协议的集合,通过API接口实现计算机软件之间的相互通信。API的一个主要功能是提供通用功能集。程序员通过使用API函数开发应用程序,从而可以避免编写无用程序,以减轻编程任务。API同时也是一种中间件,为各种不同平台提供数据共享。根据单个或分布式平台上不同软件应用程序间的数据共享性能,可以将API分为四种类型:远程过程调用(RPC):通过作用在共享数据缓存器上的过程(或任务)实现程序间的通信。标准查询语言(SQL):是标准的访问数据的查询语言,通过通用数据库实现应用程序间的数据共享。文件传输:文件传输通过发送格式化文件实现应用程序间数据共享。信息交付:指松耦合或紧耦合应用程序间的小型格式化信息,通过程序间的直接通信实现数据共享。当前应用于API的标准包括ANSI标准SQLAPI。另外还有一些应用于其它类型的标准尚在制定之中。API可以应用于所有计算机平台和操作系统。这些API以不同的格式连接数据(如共享数据缓存器、数据库结构、文件框架)。每种数据格式要求以不同的数据命令和参数实现正确的数据通信,但同时也会产生不同类型的错误。因此,除了具备执行数据共享任务所需的知识以外,这些类型的API还必须解决很多网络参数问题和可能的差错条件,即每个应用程序都必须清楚自身是否有强大的性能支持程序间通信。相反由于这种API只处理一种信息格式,所以该情形下的信息交付API只提供较小的命令、网络参数以及差错条件子集。正因为如此,交付API方式大大降低了系统复杂性,所以当应用程序需要通过多个平台实现数据共享时,采用信息交付API类型是比较理想的选择。API与图形用户接口(GUI)或命令接口有着鲜明的差别:API接口属于一种操作系统或程序接口,而后两者都属于直接用户接口。有时公司会将API作为其公共开放系统。也就是说,公司制定自己的系统接口标准,当需要执行系统整合、自定义和程序应用等操作时,公司所有成员都可以通过该接口标准调用源代码,该接口标准被称之为开放式API。
在开腾讯会议过程中摁中心键去看小说而心里却有开会时的声音算时长吗
算。
是腾讯云旗下的一款音视频会议软件
小说 api接口,于2019年12月底上线。具有300人在线会议、全平台一键接入、音视频智能降噪、美颜、背景虚化、锁定会议、屏幕水印等功能。该软件提供实时共享屏幕、支持在线文档协作。
面向用户免费开放300人的会议协同能力,直至疫情结束。此外,为助力全球各地抗疫,还紧急研发并上线
小说 api接口了国际版应用 。3月23日,开放API接口,
用UC看小说下面显示这样一个类似网站的东西api.weibo.cn refuced 以前都没
你好,这个可能是你使用的uc浏览器小说来源出问题了,
uc的小说不是它自己的,都是盗版其他地方的
所以你会发现它的小说经常会有广告,
或者是你这种链接之类的东西,影响阅读
你可以去试试换个小说来源,不行的话,那你还是卸载uc换其他的吧。
求一个能在电脑上看JAR格式小说的软件!
JAR(Java ARchive,Java 归档)、安装java软件就可以了
-------------
JAR(Java ARchive,Java 归档)是一种与平台无关的文件格式,可将多个文件合成一个文件。用户可将多个 Java applet 及其所需组件(.class 文件、图像和声音)绑定到 JAR 文件中,而后作为单个的简单 HTTP(Hypertext Tranfer Protocal,超文本传输协议)事务下载到浏览器中,从而大大提高下载速度。JAR 格式也支持压缩,从而减小了文件的大小,进一步缩短下载时间。另外,applet 编写者也可在 JAR 文件中用数字签名的方式签写各项以确认其来源。它用 Java 编写,可与现有的 applet 代码完全向后兼容且可充分扩展。
本版本的 Java 平台扩展了 JAR 格式的用途。增强功能包括增加命令行 JAR 工具的功能,可用于创建和更新已签名的 JAR 文件。同时,它也提供了读取和写入 JAR 文件的新的标准 API(Application Programming Interface,应用程序接口)。另外,Java 扩展构架 (Extensions Framework) 也提供了一种机制,用来处理扩展相关性及打包为 JAR 文件的其它第三方库。
JAR 功能
JAR 指南。
清单和签名规范
JAR 文件和扩展构架
Java 平台中的新扩展机制用 JAR 文件格式打包扩展类。为了支持扩展机制和相关功能(如包的密封和版本演变),我们提供了新的清单属性。有关详细信息,参见扩展规范。
增强 Jar 工具
Jar 工具提供了新的 -C 和 u 选项,可用于创建和更新 JAR 文件。参见 Jar 工具参考页:
Jar 工具参考页 (for Solaris)
Jar 工具参考页 (for Windows)
读取和写入 JAR 文件:API 规范
包 java.util.jar:用来创建和读取 JAR 文件的类
类 java.net.JarURLConnection:利用 jar 协议实现到 JAR 文件的 URL(Uniform Resource Locators,统一资源定位符)连接的抽象类。
教程
Java Software 站点:
Java 教程中的 Java 归档 (JAR) 文件格式。
可以批量切割的电子书切割器
建议选用这个软件TextForever
绿色,不用安装,方便,体积小,功能强。
在这里下载。http://www.comicer.com/stronghorse/
Q:TextForever是什么?
A:这是一个专为整理电子版小说而开发的工具,包括HTML到文本文件的转换、文件合并、文件切分、段落合并、段落切分、内码转换(只能在Win 2k/XP下用)、文本替换、HTML整理、文本抽取、正则表达式(需要IE 5.5以上版本的支持)、批量OCR、tcr文件压缩/解压等功能。
Q:TextForever收费吗?
A:TextForever是一个“友情软件”(Friendware),用户在承诺不用于商业目的,也不对文件及其附件进行任何更改的条件下,不需要为使用该软件支付任何费用,最多是在某个讨论区看到我发帖子灌水时(我的ID一般是strnghrs),进去捧个人场,作为友情回报;或者在年节时发个email问声好(所以叫“友情软件”)。我承诺绝不在程序中暗藏任何商业广告、木马,但不承诺为使用TextForever的后果承担任何责任。如果您需要将它用于商业目的,或加入您的网站,请与我联系,否则保留追究一切责任的权利。
Q:TextForever在使用上有什么限制?
A:部分功能对软件环境有所要求:
在“编码转换”功能中,为了省事,转码过程使用的是Windows本身提供的标准API接口。由于转码过程中需要用Unicode作为中间码,因此此功能不能在对Unicode支持非常有限的Windows 95/98/me下使用,只能在支持GBK/Big5/Shift JIS代码页的2000/XP下使用。正常情况下,只要IE能够正常显示中文简体、中文繁体、日文网页,即可正常转换。
“正则表达式”功能需要IE 5.5以上版本的支持。
所有功能均针对ANSI编码的纯文本文件,不支持UNICODE编码的文件。
Q:文件转换、文件合并功能好理解,段落合并、段落切分是干什么的?
A:段落合并其实就是某些软件所吹嘘的“自动分段”功能:在转换、识别出来的文本文件中,往往在一个自然段中间加入了若干回车/换行符,成了一行一行的了,因此需要将这些多余的回车/换行符去掉,只在自然段结尾才出现回车/换行符。有人喜欢把这个功能称为“自动分段”,我更喜欢称为“段落合并”。
段落切分是段落合并的逆过程。段落合并完成后,在某些软件下阅读时可能因为行太长,给阅读带来不便,因此需要按照指定的行长对段落进行切分,切成一个一个短行。
Q:如何OCR繁体中文、日文、韩文书籍?
A:参见《在简体中文Office 2003下OCR繁体中文、日文、韩文》。
Q:如何提高OCR的识别率?
A:参见《用Pdg2Pic、TextForever实现批量OCR》。
Q:tcr功能是干什么用的?
A:tcr的全称是Text Compression for Reader,是一种在手机和PDA上看的电子书格式,此功能用来将txt文件打包成tcr格式,或将tcr格式解包。如果您只打算在PC上看书,相信您不会用到这个功能。tcr虽然也是一种文本压缩格式,但是专门针对手机和PDA这种存储空间和处理能力都很有限的环境,压缩能力和zip、rar当然不能比,不过总比没有强。所以在手持设备能够处理象zip和rar这样复杂的文件之前,我相信都会保持其流行趋势。
Q:为什么要开发TextForever?
A:我曾经极度热衷于在PC上看小说,但是从网上下载的网页多半不适合直接离线浏览,需要进行转换、整理等,然后才能符合我的收藏标准。现成的HTML到TXT的转换工具有不少,但是集转换、合并、分段、替换等功能于一体的好像还没有,尤其是分段工具,多半分完段后都会有哭笑不得的感觉,所以我才自己开发了这个工具。后来我又开始在手机上看小说,所以又加了tcr压缩/解压、文件切分等功能。
使用说明
一、软件安装/删除
本软件为纯正的绿色软件,不需要安装,下载ZIP包后直接展开、运行即可。删除时删除可执行文件和帮助文件即可。
软件包中仅包含下列两个文件,如果有其它的,保证不是我加的,请不要犹豫,立刻删除:
TextForever.exe。可执行文件。
TextForever.htm。本帮助文件。
另外如果在运行过程中改变了参数值,会自动生成TextForever.ini文件,删除时可以一起删除。
单独删除TextForever.ini文件后重新运行TextForever,所有参数将恢复成缺省值,相当于点击了“恢复”按钮。
二、软件使用
注意:TextForever会自动记忆您所设置的参数值(记录在TextForever.ini文件中),点击“恢复”按钮可以将所有参数恢复到缺省值。
1、HTML文件到文本文件的转换(HTML-Text)
根据需要设置选项(也可以什么不选,直接使用预设值),点击“转换选定文件”按钮,在弹出的对话框中选择需要转换的文件(按住Ctrl键或Shift键点击文件,即可选多个),然后点“打开”或“Open”按钮即可;或点“转换选定文件夹”按钮,在弹出的对话框中选择起始文件夹,然后点“确定”或“OK”按钮即可。
如果点的是“转换选定文件夹”按钮,并事先选了“包括子文件夹”选项,则转换时会自动转换所有子文件夹中的htm、html、shtml文件,否则只转换所选文件夹下的文件。
如果转换出来的内容不对,可能是因为真正的内容是用JavaScript动态生成的,可以选择“使用IE内核”,然后再点“开始转换”,重新试一遍。这个选项相当于IE的“另存为文本文件”功能,用缺省选项搞不定的网页,都可以用这个选项试试看。与在IE中打开网页不同的是,如果网页中有错,这里不会弹出错误对话框要求调试网页,而是直接跳过,反正错误对获取文本没有什么影响。
对于使用UTF-8编码的HTML文件(这种文件似乎越来越多了),情况有点复杂:
如果没有选择“使用IE内核”,则转换结果取决于“UTF-8转ANSI”选项:如果该选项被选中,则结果是ANSI编码的文本文件,否则是UTF-8编码的文本文件。
如果选择了“使用IE内核”,则转换结果一律是ANSI编码的文本文件。
如果在简体中文Windows下转换简体UTF-8编码的HTML文件,或者在繁体中文Windows下转换繁体UTF-8编码的HTML文件,转换出来的ANSI编码文件都不会有任何问题,所以缺省情况下“UTF-8转ANSI”选项是被选中的。但是如果要在简体中文Windows下转换繁体UTF-8编码的HTML文件,或在繁体中文Windows下转换简体UTF-8编码的HTML文件,直接转成ANSI多半会出现乱码,在这种情况下,只能不选“使用IE内核”、不选“UTF-8转ANSI”,将UTF-8编码的HTML转换成UTF-8编码的文本文件,然后再用“编码转换”功能,先将UTF-8转换成Unicode,再将Unicode转换成GB或Big5编码。
2、文件合并(Merge Files)
一般网站刊登电子版小说时,都是一章一个文件,因此在将HTML文件转换成TXT文件后,一般还需要按照章节顺序将转换出来的诸多TXT文件合并成一个文件。
使用方法:按照界面上标示出来的1、2、3、4、5顺序,先选择需要合并的文件,再合并后的文件,并根据需要设置选项,点“开始合并”按钮即可开始合并。
需要注意的是,如果在第1步选择的是“合并文件”而不是“合并文件夹”,可以指定对文件按照中文数字进行排序,这是专门为了处理像“第二十七章.txt”、“第三十一章.txt”这样的文件名而设置的。
3、段落合并(Paragraph)
在把HTML转换成TXT文件后,由于去掉了HTML中的段落控制,转出来的文件看起来可能会参差不齐,需要重新合并、分段。
使用方法:按照界面上标示出来的1、2、3顺序,先设置“源文件段落开始标志”选项,再设置“输出文件段落控制”选项,最后选择源文件。如果是对单个文件进行处理,则在“选择源文件”框中,先点“选择...”按钮选择源文件(如果前面做过文件合并,这里会自动填入合并后的文件名,则不再需要选择),再点“开始合并”按钮开始合并;如果是对多个文件进行操作,直接点“对多个文件中的段落进行合并...”按钮,然后在弹出的对话框中选择需要操作的所有文件(按住Ctrl键或Shift键点击文件,即可选多个)。
选项说明:
“源文件段落开始标志”框指定分段条件,即在输入文件中,满足什么样的条件算一个段落。这样的条件可以有4个:
以2个或指定个数的中文空格开头。
以4个或指定个数的英文空格开头。
上一行的长度比平均行长短少1/20。一般这个条件用于OCR出来、没有整理过的文件。如下面这段文字:
他很专注的检阅着自己刚获得的新领土。
虽然自己对空气中的这股刺鼻甜味并不是很喜欢,但只要习惯之后也就没什么。
他在这块领地上绕了整整一圈。看来这里似乎没有任何敌人的样子。
他抬起头来望着一道闸门,刚才自己就是从这里出发的。虽然他看不懂门上那块
牌子的文字,不过那里确实是写着'海德伯爵城馆:帝国中最小不隆咚的贵族城
馆。'
他端正的坐在门前,并盼望那扇门能够马上开启。因为自己一路睡到刚刚才醒的
关系,被关在门外也是不得已的。
然而,那扇门却没有任何开启的迹象。
很显然,每一段的最后一行都要比其它行短。
后面跟一个空行。
“输出文件段落控制”框指定输出格式,可以指定的内容包括:
段落的引导字符:可以是2个中文空格、4个英文空格或者什么也没有。
在段落后面加一个空行。
删除原文文本行的引导空格。
删除原文文本行的末尾空格。
4、段落切分(Reparagraph)
有时候在用段落合并功能对原文中的段落进行合并、整理后,还需要按照指定的行宽,对段落进行分行,避免在没有自动环绕功能的浏览器上出现横向滚动条。
段落合并功能与段落切分功能互为逆过程,如果对切分结果不满意,可以合并后重新切分。
使用方法:按照界面上标示出来的1、2、3顺序,先设置“输出段落”选项,再设置源文件是否保留备份,最后选择源文件。如果是对单个文件进行处理,则在“选择源文件进行操作”框中,先点“选择...”按钮选择源文件(如果前面做过文件合并,这里会自动填入合并后的文件名,则不再需要选择),再点“开始切分”按钮开始切分;如果是对多个文件进行操作,直接点“对多个文件中的段落进行切分...”按钮,然后在弹出的对话框中选择需要操作的所有文件(按住Ctrl键或Shift键点击文件,即可选多个)。
如果切分结果出现行末最后一个字节是半个汉字,则该汉字被分到下一行,以免出现乱码;如果切分结果中,行末会出现把一个英文单词劈成两半,则整个单词分到下一行;如果行末是英文空白、标点符号,则按照习惯,即使这些字符超出最大行长,也不分到下一行。
选项说明:
“最大行长”项说明分行的行长,以英文字符为单位。注意一个中文字符等于两个英文字符。
“段落开头添加”选项设置分行后段落的引导字符,可以是2个中文字符、4个英文字符或者什么也没有。
“在段落后添加空行”选项说明是否需要在段落后加一个空行。
5、编码转换(GB/GBK/Big5)
这个功能可以实现GB、GBK、Big5、Unicode码的相互转换,及从日文Shift JIS到中文GB 2312、UTF-8到Unicode的单向转换。为了省事,转码过程使用的是Windows本身提供的标准API接口。由于转码过程中需要用Unicode作为中间码,因此此功能不能在对Unicode支持非常有限的Windows 95/98/me下使用,只能在支持GBK/Big5/Shift JIS代码页的2000/XP下使用。正常情况下,只要IE能够正常显示中文简体、中文繁体、日文网页,即可正常转换。
使用方法:先设置文件选项、转码选项,然后点“转换选定文件”按钮,在弹出的对话框中选择需要转换的文件(按住Ctrl键或Shift键点击文件,即可选多个),然后点“打开”或“Open”按钮即可;或点“转换选定文件夹”按钮,在弹出的对话框中选择起始文件夹,然后点“确定”或“OK”按钮即可。
如果点的是“转换选定文件夹”按钮,并事先选了“包括子文件夹”选项,则转换时会自动转换所有子文件夹中的txt文件,否则只转换所选文件夹下的文件。
转码后如果出现固定的错别字,可以用“文本替换”功能进行修正。
文件选项说明:
覆盖原文件:转换后的文件将覆盖转换前的文件。
原文件另存为 bak 文件:转换后的文件不会覆盖转换前的文件,转换完成后将在原文件名后加后缀.bak。
转码选项说明:左侧为原文件中的汉字编码,右侧为转换后的汉字编码。
GB码:按照国家标准GB2312-80编排,包括全部简体字及常用符号。在中文简体版的Windows下显示为简体,在繁体版Windows下显示为乱码。
GBK码:是国家技术监督局1995年为中文Windows 95所制定的新的汉字内码规范(其中GB表示国标,K表示扩展)。该规范在字汇一级上支持ISO10646和GB13000中的全部中日韩(CJK)汉字,并与国家标准GB2312-80信息处理交换码相兼容。如果在中文简体版的Windows 95/98/2000下看到繁体中文或繁简混杂,那么多半这些中文是用GBK编码的。
Big5码:港台地区流行的汉字编码,针对繁体字。这种编码的汉字在中文简体版的Windows 95/98/2000下多半显示为乱码,但是在繁体版Windows下显示正常。
Unicode码:Windows 2000/XP下的字符编码,全世界的文字都可以用统一的编码进行表示。在Windows 95/98/Me下显示,看到的可能是一堆问号。
Shift JIS:日文编码的一种。
UTF-8码:Unicode编码的一种实现。
6、文本替换(Replace)
对指定的文件进行批量文本替换,包括去除HTML文件中的广告链接、js/css代码,或从TXT文件中去掉某些固定的文本等。
在设计这个功能时,主要依据我平时对文件进行整理的经验,同时参考了UltraEdit32 v10.10a、居辰工作室的Text Witch v1.0、风林的文本整理器 v2.0等的长处。另外为了加快速度,替换前先将整个文件读入内存,然后在内存中进行替换,因此处理某些巨型文件时可能会有问题,不过处理通常几个MB的文件应该没啥问题。
使用方法:先设置替换选项,然后输入替换内容,即可开始替换。
“替换选项”说明:
匹配全词:对中文没用,不用点。
忽略大小写:对中文没用,不用点。
Unix格式转Windows格式:Unix格式的文本文件以\n为换行符,Windows格式的文本文件以\r\n为换行符。通常这个选项也不用点。
“替换选项”中每选择一个选项,都会增加一定的处理时间,“忽略大小写”选项被选中后,还会增加内存消耗,因此请尽量不要选择不必要的选项。
输入替换内容的方法:可以点“添加文本”或“添加字符”按钮添加内容,也可以点“调入”按钮调入以前保存的内容。每项内容都可以包含多行,一次可以对多项内容进行替换,特别适合于批量整理从网上下载的HTML文件。如果经常需要整理从同一个网站下载的网页,可以在输入全部替换内容后,点“保存”按钮存盘,以后再整理该网站的网页时,点“调入”按钮即可载入替换内容。
“开始替换”选项说明:
如果只需要对某个或某几个文件进行替换,可以点“选择并替换指定的文件”按钮,在弹出的对话框中选择文件即可。按住Ctrl或Shift键点击文件,即可一次选定多个文件。
如果需要对某个文件夹下的文件进行替换,可以先在“文件”框中选择或输入文件选择标准,再点“文件夹”框右侧的按钮选择文件夹,点击“替换指定文件夹下的文件”按钮即可。如果“包括子文件夹”选项被选中,则连子文件夹下的文件一起替换。
7、HTML整理(Tidy HTML)
这个功能主要用于整理从网站上批量下载的HTML文件,包括去掉其中的广告链接、不合适的CSS设置及功能限制(禁止选择、禁止拷贝、禁止右键菜单)等,也可以解密某些HTML加密软件加密的HTML页。对于做E书的人来说,还可以用来在打包前先检查一下HTML页面中是否包含指向本地磁盘的绝对链接。
使用方法:
先选择需要整理的HTML文件所在文件夹。
根据需要选择检查选项,然后点“检查”按钮开始对文件进行扫描。
扫描结果出来以后,先逐项双击打开看看,对不合适的可以编辑或删除。搞定后,点“替换表中所有项”按钮,对HTML文件进行替换。如果觉得一项一项双击打开看太麻烦,也可以导出成HTML文件看,但是一定要看,不然可能发生悲剧。
注意:在第三步开始替换后,原始HTML文件将会被替换,请事先做好文件备份,以免后悔。
选项说明如下:
包括子文件夹:如果此选项被选中,则扫描时包括选定文件夹下面的所有子文件夹。
Unix格式转Windows格式:Unix格式的文本文件以\n为换行符,Windows格式的文本文件以\r\n为换行符。通常这个选项也不用点。
解密网页:对加密HTML文件进行解密,然后对解密结果进行检查。对于未加密网页来说,勾上这个选项后,不仅检查速度会变慢,而且整理后的网页代码看起来好象重新排过版一样(其实是被IE内核重新排版),所以缺省此选项未被选中。
检查绝对链接:检查网页中是否包含绝对链接。检查时不包括anchor链接。理论上说,打包E书的所有链接都必须是相对链接,不能是绝对链接。
检查CSS:检查网页中是否包含样式表。对于不满意的样式表可以替换或清除。
检查Script:检查网页中是否包含脚本。通常广告链接都在脚本里。
检查功能限制:检查网页里是否包含功能限制,包括禁止选择、禁止拷贝、禁止右键菜单等。
在选择解密网页、检查绝对链接、检查CSS、检查Script、检查功能限制等选项时要注意,如果都选上,不仅检查速度慢,而且可能一次列出太多的检查结果,因此应该根据需要,一次只检查一项或几项,不需要的选项不必选。
8、文件切分(Split Files)
能够按照指定的大小切分文本文件,并且避免因为切出半个汉字而造成乱码,或将一个英文单词切到两个文件中。
某些手机对jar文件大小有限制,所以在制作jar电子书前,往往需要先对文本文件进行切分,然后再打包成jar书。
使用方法:
先设置“文件选项”,再设置“文件最大长度”,然后点击“开始”按钮,在弹出的对话框中选择需要切分的文件(可多选)即可。每切分一个文件,都会在您所选的文件所在目录下创建一个子目录,存放切分后的文件。
9、文本提取(Extractor)
从文本中抽取或删除指定的内容。其实这个功能完全可以通过正则表达式替换实现,不过考虑到正则表达式不是人人都懂,所以还是单独做了这么一个大众化的功能。
使用方法:
选择需要进行的操作,究竟是“提取”还是“删除”起始点到结束点之间的内容。
指定在输出时,是否要输出起始点、结束点的内容,如起始点字符串、结束点字符串。
设置起始点。
设置结束点。
设置在提取完成后,如何处理原TXT文件。
根据需要,点击“开始提取”框中的按钮。
“开始提取”选项说明:
如果只需要对某个或某几个文件进行提取,可以点“选择并提取指定的文件”按钮,在弹出的对话框中选择文件即可。按住Ctrl或Shift键点击文件,即可一次选定多个文件。
如果需要对某个文件夹下的文件进行提取,可以先在“文件”框中选择或输入文件选择标准,再点“文件夹”框右侧的按钮选择文件夹,点击“提取指定文件夹下的文件”按钮即可。如果“包括子文件夹”选项被选中,则连子文件夹下的文件一起提取。
10、正则表达式(RegExp)
运用正则表达式,实现批量文本查找、文本替换、文件切分功能。合理使用这些功能,可以全部或部分代替本软件的下列功能:Html-Text、段落合并、段落切分、文本替换、HTML整理、文件切分、文本提取,当然前提条件是您能够写出正确的表达式,否则建议您还是隐藏这个页面吧。
支持正则表达式的软件在实现时通常都基于某个成熟的正则表达式引擎,目前可用的引擎有不少,从开源的到封装过的都有。从我试用的结果来看,开源的几个引擎用起来都有点麻烦,尤其在处理MBCS(多字节字符集)的时候,偏偏中文就是典型的MBCS。而微软在JScript/VBScript中提供的正则表达式引擎,不仅接口简单、使用方便,对MBCS的支持也没话说,所以成为我的首选。而这个引擎目前又有两个版本:1.0版和5.5版。1.0版从IE 5开始支持,5.5从IE 5.5开始支持。从我测试的情况看,5.5版至少在以下方面比1.0版强:
1、支持非贪婪模式,而1.0版所有匹配都是贪婪的。
2、支持Multiline选项,这个对^、$有影响,而且很常用。
所以我没啥好犹豫的,直接就选择了5.5版。当然由此也带来了两个限制:
1、TextForever的正则表达式功能只能在装有IE 5.5以上版本的机器上使用。不过现在IE 6应该已经算标配了吧?
2、由于JScript/VBScript内部均基于UNICODE,所以在表达式中计算字符数的时候,一个中文字也算一个字符,而不是象通常ANSI环境下,一个字母、数字算一个字符,一个中文字算两个字符。编码转换使用当前系统缺省代码页。
微软正则表达式引擎5.5版的详细说明见JScript/VBScript的相关文档,在本文附录B部分给出了一个语法表,摘自微软出版的《VBScipt 用户指南》电子版。这个基本上是给会写正则表达式的人士参考用,用它来学写正则表达式可能有点困难,如果真想学,建议还是老老实实找本书去翻翻吧:这个正则表达式引擎要比我用过的EditPlus v2.10c、UltraEdit32 10.10a的复杂和强大许多,包括向后引用(Backreferencing)等。
使用方法:
1、“添加”正则表达式。添加时可以先测试一下表达式的效果。如果表达式不正确,在这里才给出提示。表达式输入后,可以“上移”、“下移”、“删除”、“修改”,也可以“保存”,在需要的时候再“调入”,以重复利用。
2、选择需要操作的文件所在文件夹,及需要操作的文件。如果“含子文件夹”选项被选中,则操作包括所选文件夹及其下所有子文件夹中的文件,否则只处理所选文件夹中的文件。
3、根据需要,选择“查找”、“替换”或“文件切分”操作。为了保险,建议在做替换或切分之前,先用查找功能查一次,看看正则表达式的匹配结果与想像的是否一致,以免一失足成千古恨。
在输入正则表达式时,允许有三个选项:
全局搜索(Global):指明在搜索正则表达式的匹配时,是搜索文件中的所有匹配,还是只搜索第一个匹配。缺省为选中,即搜索所有匹配。
忽略大小写(Ignore Case):指明搜索正则表达式匹配时是否忽略大小写。这个对中文没用,所以缺省未选中。
多行文本(Multiline):如果被选中,那么 "^" 匹配每行的开始位置,而 "$" 匹配每行的结束位置。如果未被选中,那么 "^" 匹配文件的开始位置,而 "$" 匹配文件的结束位置。缺省为选中。
11、OCR
将单色TIFF文件批量OCR成文本文件,结果文件可单独存放,也可以合并成一个大文本文件。使用本功能前请先阅读《用Pdg2Pic、TextForever实现批量OCR》、《在简体中文Office 2003下OCR繁体中文、日文、韩文》。
使用方法:先选择需要OCR的文件夹,然后选择结果文件,再根据需要设置OCR选项(通常不需要更改缺省设置),点“开始OCR”即可。
OCR选项说明:
1、自动旋转:如果页面出现歪斜,用此功能可以纠斜。
2、自动拉伸:如果页面长宽比例失调,可以用此功能校正。
3、OCR语言:选择OCR语言。目前允许选择英文、中文简体、中文繁体、日语。
自动旋转、自动拉伸均需要时间,考虑到多数PDG文件不需要进行校正,因此这两个选项缺省不选中。如果页面确实变形比较厉害,可以选中后重新OCR。
12、TCR
将文本文件批量压缩成tcr文件,或将tcr文件批量解压成文本文件。压缩时可以选择是否过滤空白符、段落标记,以节省存储和显示空间。这个功能是专门给制作在手机和PDA上阅读的电子书用的,如果您只打算在电脑上看书,相信您不会用到这个功能。
使用方法:
TXT文件压缩:先设置“压缩文件选项”,然后点击“开始压缩”按钮,在弹出的对话框中选择需要压缩的文件(可多选)即可。压缩后的文件和您所选的文件在同一目录下,如果有同名文件,将会被自动覆盖。
TCR文件解压:点击“开始解压”按钮,在弹出的对话框中选择需要解压的文件(可多选)即可。解压后的文件和您所选的文件在同一目录下,如果有同名文件,将会被自动覆盖。
Q+是什么
,“Q+”是一个基于Windows系统的开放式应用平台,当用户一键切换到“Q+”后,它将接管原有的 Q+web历史特性
[1]Windows桌面。通过它,用户可以便捷地进入互联网丰富多彩的世界,享受到第三方应用商提供的丰富的互联网应用。 初一看Q+和自家的WebQQ以及其
小说 api接口他桌面类软件(360桌面等)比较相似,但就目前来看,Q+的野心似乎更加庞大。据了解,“腾讯将尝试以API接口的形式通过Q+向第三方应用商提供如内容分享、文件传输、语音视频等核心功能组件,第三方应用商则可通过这个平台进行调用,将这些用户使用
Q+QWeb新增功能(5张)最多、最喜爱的核心功能植入到创新应用中,从而直接服务于超过6.47亿的QQ用户,创造更大的价值”。一旦这种合作形式步入正轨,也就意味着Q+平台上的应用数量将不成问题,无论是微博、在线视频、即时交流这些热门应用还是其
小说 api接口他互联网应用,只需要一个Q+平台即可实现。 想象一下,如果腾讯将Q+整合进QQ客户端或者和WebQQ打通(相信这个可能性会相当高),QQ用户将自然而然成为Q+平台用户,几乎不需要额外使用成本,接受起来也会比较容易。腾讯若能进一步充分利用云计算,将用户的Q+桌面同步到服务器,就可以大大降低对于操作系统的依赖。这也意味着将来无论你到哪里,只要有一台能上网的电脑,登录Q+平台后就和自己的电脑相差无几了。 腾讯WebOS?没错,Q+平台的推出,已经给我们展示了腾讯WebOS的基本雏形,从它准备开放平台API接口这一举动就可以猜想到Q+的长远目标。虽然目前还需要依靠Windows平台,但是谁知道将来会不会像ChromeOS那样发展成为一个完整的硬件+基本UI界面+Web应用的腾讯OS呢?
关于小说 api接口和网络小说平台api接口的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。
小说 api接口的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于网络小说平台api接口、小说 api接口的信息别忘了在本站进行查找喔。
版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。
暂时没有评论,来抢沙发吧~