找回密码
 立即注册
搜索
查看: 5129|回复: 27

[软件] 求 “文件内容搜索” 软件

[复制链接]
     
发表于 2023-11-2 16:23 | 显示全部楼层 |阅读模式
办公有5000多个文档文件。按类型分类:
80%  Word、Excel类型
10%  WPS类型
5%    PDF类型
5%    RAR、zip压缩包(内含Word文档)


按大小分类:10k~100k 占90% ,100k~10M(含图片)占10%


文件命名无规律:
比如“统计6.doc”,里面的内容是2016年3月销售额。
比如“统计B.docx”,里面内容是双桥公司还款记录。


求文档内容关键词搜索软件。
比如:
“原料”。就能找出内容含“原料”的所有文件。
”泉山区“。就能找出所有含”泉山区“的文件。


因有5000多个文件,要求搜索速度越快越好。
若搜索一个关键词,象全盘杀毒一样。那不可接受。


回复

使用道具 举报

     
发表于 2023-11-2 16:27 | 显示全部楼层
本帖最后由 lzrtwilight 于 2023-11-2 16:34 编辑

https://anytxt.cbewin.com/
我用来搜电子书的,还可以。但是要空间建立索引文件,且进程常驻,不然新增文件搜不到。

评分

参与人数 1战斗力 +1 收起 理由
satan023 + 1 6

查看全部评分

回复

使用道具 举报

     
发表于 2023-11-2 16:30 | 显示全部楼层
本帖最后由 mhss 于 2023-11-2 16:32 编辑

textseek(对图片类pdf和压缩包无效)
付费软件,但奇怪的是试用期30天过了并不影响使用
回完贴才注意到发帖人

回复

使用道具 举报

     
发表于 2023-11-2 16:32 | 显示全部楼层
这有什么办法,放固态硬盘上搜呗
想要搜索得快前提是排序和索引,不存在凭空出现的算法
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-2 16:41 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2023-11-2 16:55 | 显示全部楼层
软件everything
回复

使用道具 举报

     
发表于 2023-11-2 16:57 | 显示全部楼层
付费买了textseek,支持下国产软件了
回复

使用道具 举报

     
发表于 2023-11-2 16:59 | 显示全部楼层
everything吧   用content:keyword 检索内容关键词,可以在指定路径下搜索。试了下,在越500个xlsx和docx文件里花了十几秒检索出了含关键词的表格

—— 来自 S1Fun
回复

使用道具 举报

     
 楼主| 发表于 2023-11-2 17:00 | 显示全部楼层

Everything,能搜索文档内容吗?
回复

使用道具 举报

     
发表于 2023-11-2 17:23 | 显示全部楼层
proof1 发表于 2023-11-2 17:00
Everything,能搜索文档内容吗?

everything→搜索→高级搜索里面:文件内容中包含的单词或短语。
点了一下,机械硬盘磁场转动一百万匹,把everything卡未响应了。建议限定到机械硬盘来检索。
回复

使用道具 举报

     
发表于 2023-11-2 17:24 | 显示全部楼层
textseek+1
国产软件,正在考虑支持一份
回复

使用道具 举报

     
发表于 2023-11-2 17:30 来自手机 | 显示全部楼层
签收通知 发表于 2023-11-2 17:23
everything→搜索→高级搜索里面:文件内容中包含的单词或短语。
点了一下,机械硬盘磁场转动一百万匹, ...

限定扩展名和路径啊,全盘搜肯定卡了

—— 来自 Xiaomi MI 8, Android 10上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-11-2 17:50 | 显示全部楼层
搜文本内部内容?anytxt Searcher
公司每隔五六年都要清一些东西,就那这个找
回复

使用道具 举报

     
发表于 2023-11-2 19:35 | 显示全部楼层
anytxt searcher 也挺好的
但还是怀念win7时候的系统搜索,按时候对三件套内容搜索真的方便
回复

使用道具 举报

     
发表于 2023-11-2 19:57 来自手机 | 显示全部楼层
以前是百度硬盘搜索、谷歌硬盘搜索都支持你列出的格式包括压缩包
可惜后来都不做了,连对新系统的支持也不行了。

我记得还有个软件是个人作品叫88data,在xp系统上很好用,但没坚持下去。

后来转移到linux上面,用的recoll.

顺手搜了下桌面搜索软件,看到一个15款软件的对比。

https://zhuanlan.zhihu.com/p/371466155?utm_id=0


—— 来自 HONOR LSA-AN00, Android 12上的 S1Next-鹅版 v2.5.4
回复

使用道具 举报

     
发表于 2023-11-2 20:04 来自手机 | 显示全部楼层
FileLocatorPro 简单好用
回复

使用道具 举报

     
发表于 2023-11-2 21:01 | 显示全部楼层
XP时的资源管理器就能很方便的搜出各种OFFICE文件的内容,然而从7开始就半废了,要么明明存在的内容搜不出来,要么搜到完全无关的内容
回复

使用道具 举报

     
发表于 2023-11-2 22:13 | 显示全部楼层
docfetcher,机械硬盘搜起来也挺快的
回复

使用道具 举报

     
发表于 2023-11-3 07:37 | 显示全部楼层
像我现在是listary+anytext search用,前者可以自定义路径,后者可以直接通过原文找出,不过如果是图片内的文字不知道支不支持
回复

使用道具 举报

     
发表于 2023-11-3 08:45 | 显示全部楼层
Windows系统自带的索引就可以搜索内容啊....设置里面对应格式的勾 勾上就行了...
回复

使用道具 举报

     
发表于 2023-11-3 09:10 | 显示全部楼层
FileLocatorPro
回复

使用道具 举报

     
 楼主| 发表于 2023-11-3 10:35 | 显示全部楼层
佳丽三千到 发表于 2023-11-2 19:57
以前是百度硬盘搜索、谷歌硬盘搜索都支持你列出的格式包括压缩包
可惜后来都不做了,连对新系统的支持也不 ...
顺手搜了下桌面搜索软件,看到一个15款软件的对比。
https://zhuanlan.zhihu.com/p/371466155?utm_id=0
-------------------------------------------------------------------------------
这个网址太好了 !   深入浅出、一目了然。
回复

使用道具 举报

     
发表于 2023-11-3 10:54 | 显示全部楼层
TextSeek收费,用的AnyTXT Searcher,也还行.
回复

使用道具 举报

发表于 2023-11-3 14:57 | 显示全部楼层
俺以前装office时系统是有全文搜索的,换wps后全文搜索就没了,补装筛选器后能搜索但没预览
回复

使用道具 举报

头像被屏蔽
     
发表于 2023-11-3 16:28 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

发表于 2023-11-3 19:15 | 显示全部楼层
https://github.com/dnGrep/dnGrep
grep的增强版
支持压缩文件
搜了下doc需要安装word(docx不需要)

不需要建立索引但速度稍慢了一点
我这5G+的 1W+个txt文件搜索一次耗时23秒

回复

使用道具 举报

发表于 2023-11-4 08:08 来自手机 | 显示全部楼层
感觉没索引想达到everything那种性能还是比较吃力。
回复

使用道具 举报

     
发表于 2023-11-4 09:28 | 显示全部楼层
macos 发表于 2023-11-3 14:57
俺以前装office时系统是有全文搜索的,换wps后全文搜索就没了,补装筛选器后能搜索但没预览 ...

你把office卸载了那肯定没有预览, 例如预览.docx就是后台开一个word进程的啊.

不过很多文本搜索软件都不支持.wps格式的, 确实挺不友好
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-9-20 20:21 , Processed in 0.096025 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表