【当AI想接管你的手机,用户最在意什么?】一个Android应用开发团队最近在Reddit发起了一场讨论,他们正在开发一款名为zerotap的应用,能让AI像人类一样操控手机:点击、滑动、阅读屏幕。支持Ollama本地模型,也兼容OpenRouter、OpenAI、Claude等各类服务。开发者想知道:下一步该优先做什么?MCP服务器集成、深度网络研究、多模态图像处理,还是继续打磨设备端模型?但社区的反应出人意料。技术方向的讨论很快被一个更根本的问题淹没:信任。“必须开源,否则连考虑都不会考虑。”这条评论迅速成为最高赞。一款能完全控制手机的应用,如果代码不透明,用户凭什么相信它不会偷偷上传数据?开发者解释说已经支持BYOK模式和Ollama本地部署,用户可以完全掌控数据流向。但社区的态度很明确:光靠承诺不够,代码才是证据。也有人质疑这是“寻找问题的解决方案”。AI操控手机的速度明显比手动慢,意义何在?开发者给出的答案是:解放双手。开车时语音发消息、远程启动没有API的汽车应用,甚至有用户用它根据资料自动刷交友软件。配合Tasker等自动化工具,它能处理那些传统自动化无法触及的场景:没有API的应用、复杂的多步骤UI交互。有趣的是,关于“你们会把Ollama暴露到公网吗”这个问题引发了一些误解。开发者澄清说,他只是好奇用户的实际使用习惯,并非建议这么做。但这个问题本身让一些人警觉:提出这种问题的人,其安全意识是否可靠?真正有建设性的需求也不少。有人想要完全离线的语音助手,能做到“打开手机,查看还有多久到家,给我哥发消息说我会晚十分钟”。有人关注无障碍使用场景,认为这对视障用户价值巨大。还有人希望增加知识库功能、持久记忆、自定义AI人设。一位用户提出了一个很实际的想法:离线排队功能。断网时先记录指令,联网后再处理。另一位则想要桌面小组件,随时快速调用。开发者的回应相当坦诚。面对“你们根本不知道自己在做什么”的批评,他没有防御性反驳,而是解释应用已有真实用户和使用场景,主动询问反馈恰恰说明团队愿意倾听而非闭门造车。这场讨论揭示了一个有趣的张力:AI能力越强大,用户对透明度和控制权的要求就越高。当AI能代替你点击屏幕、阅读内容、执行操作时,它实际上获得了巨大的权限。技术可行性和用户信任之间的鸿沟,可能比功能迭代本身更难跨越。那些真正能落地的AI应用,往往不是技术最酷炫的,而是最能让用户感到安心的。www.reddit.com/r/LocalLLaMA/comments/1qmir5d/what_do_you_actually_want_from_a_private_ai_chat/
