找回密码
 立即注册
搜索
查看: 5610|回复: 33

[新闻] 百度手机输入法被Vivo NEX检测出后台录音, 官方回应是为...

[复制链接]
头像被屏蔽
     
发表于 2018-7-2 10:35 | 显示全部楼层 |阅读模式
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

头像被屏蔽
     
发表于 2018-7-2 10:43 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-2 10:56 | 显示全部楼层
一直奇怪为什么许多应用给了读短信的权限也不自动输入验证码,看来要清理一下权限了

  -- 来自 有消息提醒的 Stage1官方 Android客户端
回复

使用道具 举报

     
发表于 2018-7-2 11:37 | 显示全部楼层
看到流氓扭捏狡辩的样子真是大快人心

  -- 来自 能手机投票的 Stage1官方 Android客户端
回复

使用道具 举报

发表于 2018-7-2 11:45 来自手机 | 显示全部楼层
包括上次企鹅那篇澄清,都是解释的极为技术化,和平时那种公关文完全不同的语气,可以说是真的重视这个问题了,谁曾想一台新手机的上市能引起这种风波
回复

使用道具 举报

头像被屏蔽
     
发表于 2018-7-2 11:56 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-2 14:30 | 显示全部楼层
难道不是应该需要用的时候,点击下才会调用,这尼玛提前调用还想忽悠用户?
回复

使用道具 举报

头像被屏蔽
     
发表于 2018-7-2 14:37 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-2 15:57 | 显示全部楼层
其实我不明白收集录音内容有啥用,仅仅是声纹数据?
回复

使用道具 举报

     
发表于 2018-7-2 16:22 | 显示全部楼层
呱啦啦 发表于 2018-7-2 15:57
其实我不明白收集录音内容有啥用,仅仅是声纹数据?

收集后就知道你晚上几点交公粮啦
回复

使用道具 举报

发表于 2018-7-2 16:45 | 显示全部楼层
所以以后把机型改成vivo nex,除了可以享受腾讯游戏的多线程优化外还能保护隐私?
回复

使用道具 举报

     
发表于 2018-7-2 18:42 来自手机 | 显示全部楼层
udisyue 发表于 2018-7-2 12:22
收集后就知道你晚上几点交公粮啦

然后可以根据时间推送延时药物广告
回复

使用道具 举报

     
发表于 2018-7-2 19:39 | 显示全部楼层
有时候QQ聊天讨论某个东西后淘宝或者京东搜索栏自动就加上了这个商品
回复

使用道具 举报

头像被屏蔽
发表于 2018-7-2 20:29 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-3 08:44 | 显示全部楼层
geniusghx 发表于 2018-7-2 14:37
其实这篇公告的意思是,觉得你要录音了,就提前启动了录音机, 然后点击录音的时候将已经录好的声音截取 ...

意思是这个语音识别启动需要时间 用户在点击语音识别后立刻就开始说话 但这时候还没有启动好 就会出现丢字的现象 体验不好.  所以当他认为用户可能会调用语音识别的时候就先启动好 以避免丢字的情况

这是个挺常见的优化 理由其实蛮合理的 只是涉及到隐私 比较敏感
回复

使用道具 举报

头像被屏蔽
     
发表于 2018-7-3 08:55 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-3 09:32 | 显示全部楼层
连输入框都没有录你MB的场景音
回复

使用道具 举报

头像被屏蔽
     
发表于 2018-7-3 10:02 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-3 10:47 | 显示全部楼层
jonz 发表于 2018-7-2 20:29
不然大数据从哪里来

每个人每天说多少话,又有多少是跟商家毫无关系毫无营养的东西,这是多么巨大的数据量。
商家疯求了才会去分析每个人的录音。

唯一有用的估计只有声纹数据。
回复

使用道具 举报

     
发表于 2018-7-3 11:00 来自手机 | 显示全部楼层
万万没想到,你国流氓app们从nex量产开始就无法再像之前那么滋润的无法无天下去了
回复

使用道具 举报

     
发表于 2018-7-3 11:05 | 显示全部楼层
呱啦啦 发表于 2018-7-3 10:47
每个人每天说多少话,又有多少是跟商家毫无关系毫无营养的东西,这是多么巨大的数据量。
商家疯求了才会 ...

抓关键字啊,数字化监听
回复

使用道具 举报

     
发表于 2018-7-3 11:30 | 显示全部楼层
无念 发表于 2018-7-3 11:05
抓关键字啊,数字化监听

那数据量也不会小啊,一个人一天的录音文件诶,一分钟的录音就差不多1mb了,就算质量降一点,你算算这是多么大的量,这么多都要上行到服务器去筛选?你不要告诉我那么小一个客户端就可以实现语音内容识别和筛选。
回复

使用道具 举报

     
发表于 2018-7-3 11:33 | 显示全部楼层
呱啦啦 发表于 2018-7-3 11:30
那数据量也不会小啊,一个人一天的录音文件诶,一分钟的录音就差不多1mb了,就算质量降一点,你算算这是 ...

棱镜曝光以前,大家也觉得美国没这么有空的
回复

使用道具 举报

     
发表于 2018-7-3 12:03 | 显示全部楼层
无念 发表于 2018-7-3 11:33
棱镜曝光以前,大家也觉得美国没这么有空的

资本家才没你想的这么闲

资本家是要赚钱的, 如果真的想获取隐私数据, 直接把输入法的内容上传了就行了.
不比偷偷录音频再上传到服务器上再分析高效的多?
回复

使用道具 举报

头像被屏蔽
     
发表于 2018-7-3 12:04 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-3 12:52 | 显示全部楼层
wyjbnb 发表于 2018-7-3 12:04
可以本地直接抓取关键词,上传关键词没必要上传这么多数据

也就是说语音分析的,关键词抓取的的程序很小就能实现?百度输入法大小130多mb,请问在实现基本的输入法功能以外,怎么实现的?
要知道语音输入实际上也是上传服务器实现的识别,你家本地程序怎么牛逼?
随时随地上传产生的流量两三天就能撑爆你的套餐。
回复

使用道具 举报

     
发表于 2018-7-3 12:54 | 显示全部楼层
无念 发表于 2018-7-3 11:33
棱镜曝光以前,大家也觉得美国没这么有空的

棱镜也是直接在服务器端实现的抓取,并没有要你终端直接传到棱镜那里。
很现实的问题,流量,这么大的终端流量怎么解决。
回复

使用道具 举报

     
发表于 2018-7-3 13:32 来自手机 | 显示全部楼层
nb你们不用啊,如果你们继续用的话对百度有啥影响?

— from Google Pixel 2, Android 8.1.0 of S1 Next Goose v2.0-play
回复

使用道具 举报

发表于 2018-7-3 13:33 | 显示全部楼层
看了下上面的,感觉很多都说错了。
1、录制语音的大小可以做到很小的(人声的频宽不大的)。录制语音的编码里面,拿 G.723.1 来说可以做到 5-6 kbit/s。(https://en.wikipedia.org/wiki/G.723.1
2、语音数据还是蛮有用的,大数据蛮需要的,而且容易推广广告或者其他用处。现在机器学习分析样本数据越多越有用的,不过感觉比起公共场所的语音,判断地点上传家里里说的话感觉价值蛮高些。
3、130mb 很大很大了,现在 apk 图片这类的资源还是大头的,代码有个几十mb已经可以干非常非常多的事情了(比如说 Linux 的内核 10MB 都不到)。而且 Android 手机本身也提供了很大的功能,所以很多代码不算在 apk 里的。
回复

使用道具 举报

     
发表于 2018-7-3 13:42 | 显示全部楼层
shahito 发表于 2018-7-3 13:33
看了下上面的,感觉很多都说错了。
1、录制语音的大小可以做到很小的(人声的频宽不大的)。录制语音的编码 ...

好吧,学习了。
回复

使用道具 举报

     
发表于 2018-7-3 14:32 | 显示全部楼层
shahito 发表于 2018-7-3 13:33
看了下上面的,感觉很多都说错了。
1、录制语音的大小可以做到很小的(人声的频宽不大的)。录制语音的编码 ...

的确,像桌面版的谷歌输入法大约15兆,百度手机输入法100来兆,不知道里面都加了多少功能
回复

使用道具 举报

     
发表于 2018-7-4 20:03 | 显示全部楼层
百度的东西怎么敢用,屁眼都烂掉的公司……无条件支持百度倒闭
回复

使用道具 举报

头像被屏蔽
     
发表于 2018-7-4 20:27 来自手机 | 显示全部楼层
提示: 作者被禁止或删除 内容自动屏蔽
回复

使用道具 举报

     
发表于 2018-7-5 04:04 | 显示全部楼层
本帖最后由 BRRM 于 2018-7-5 04:43 编辑
呱啦啦 发表于 2018-7-3 11:30
那数据量也不会小啊,一个人一天的录音文件诶,一分钟的录音就差不多1mb了,就算质量降一点,你算算这是 ...

一分钟1mb,你当听MP3啊。

随便处理下1分钟最多也就60k这样,你自己听听吧,1分钟60kbps的MP3编码的效果。如果换个适合极低码率的编码器的话,还能更低。
(我只压缩了振幅,没有把压缩后的振幅放大,所以得开大声才听得到。
   另外,我直接把后面的都删掉了,实际上长度只有1分05秒)

链接: https://pan.baidu.com/s/1zO8v4HFaiFAezMd1yy-qoA 密码: 8hp4

经过专业点处理,比如压到4bit位深,1500hz采样率,处理下时间空白的部分,再弄一个基于深度学习的编码器来应付极小码率时候的情况,再小75%都不是问题。反正最后是机器听不是人听,只要机器听得懂就行了。届时1分钟也许只要10~20KB,随便录好不好。
没用过安卓,不知道app之间是否可以通信,如果可以通信的话,让录音文件和其他app的包绑在一起发送出去,根本就发现不了好不好。
宽松情况下,直接把音频发送出去,极端情况下,将语音识别成文字再发送出去,根本就不怕你话多。这样我在服务端拿到语音文件后,可以继续拿去训练。
再来极端点的,大公司招点人,逆向手机的驱动程序,之后再重写一个api,咱不调用你的api,你根本就没办法提示。只要你家麦克风不是向伸缩摄像头那样就行了。

总之办法多的是,但日子还是得过的,只能说看你信不信了。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|上海互联网违法和不良信息举报中心|网上有害信息举报专区|962110 反电信诈骗|举报电话 021-62035905|Stage1st ( 沪ICP备13020230号-1|沪公网安备 31010702007642号 )

GMT+8, 2024-11-19 01:25 , Processed in 0.137952 second(s), 5 queries , Gzip On, Redis On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表