DC娱乐网

读AI赋能10助手

1.GPS1.1.地图1.1.1.在21世纪初之前,“纸质地图”这个词并不存在,它们当时只是被称为“地图”1.1.2.物

1. GPS

1.1. 地图

1.1.1. 在21世纪初之前,“纸质地图”这个词并不存在,它们当时只是被称为“地图”

1.1.2. 物理世界缩小至我们的掌心,我们的视野却因此变得更加开阔

1.2. 1973年,美国国防部启动了一个项目,这个项目最终演变为全球定位系统(GPS)

1.2.1. GPS的核心技术由美国军方独家掌控

1.3. GPS利用多颗中轨道地球卫星发出的无线电信号,来确定地面接收器的地理坐标

1.3.1. GPS主要处理客观的、真实的时空数据,如地理坐标和精确的时间戳

1.4. 20世纪70年代末,美国空军已开始对这个系统的早期版本进行测试,但当时仅限于军事用途

1.5. 1983年,一架韩国客机因偏离航线,误入他国领空被击落

1.5.1. 为避免此类灾难再次发生,美国时任总统罗纳德·里根宣布,在GPS全面投入使用后,将向民用领域开放

1.6. 1989年,麦哲伦公司(Magellan Corporation)推出了首款面向市场的手持GPS接收器Nav 1000,按2023年的美元汇率计算,其售价高达7727.02美元

1.6.1. “选择性可用性”(Selective Availability)

1.6.2. 出于对国家安全以及其他潜在滥用风险的担忧,空军故意干扰民用信号,使得其定位精度只有信号真实值的1/10

1.7. 在1996年比尔·克林顿总统宣布,美国政府将很快终止“选择性可用性”政策,让大众也能享受到与美军相同水平的GPS服务

1.8. 1984—2017年,GPS技术为公共部门创造了高达1.4万亿美元的经济效益,其中90%的收益集中产生于该时间段的后7年

1.9. 尽管逐向导航可能是GPS最常见的用途,但它的应用远不止于此

1.9.1. GPS提供的精准时间信息,能够同步电信网络中的时钟,有助于保持手机通话清晰、无延迟

1.9.2. 在自然灾害等紧急情况下,搭载GPS的无人机能帮助救援人员迅速定位失踪者,快速绘制灾区地图,甚至向难以抵达的地区运送紧急物资

1.9.3. GPS还支持精准农业技术,使得有机农产品(如芝麻菜)的价格更加亲民

1.10. 其最具革新性的应用是逐向导航

1.10.1. GPS及其衍生的商业服务,使我们能够依据实时更新的信息在物理世界中穿行

1.10.2. 在每一个转弯处,这些导航系统通过告知我们所在的位置、周边环境、需要避开的障碍等,增强了个体能动性

1.11. 展现了当政府采取亲技术、亲创新的立场,并将私营企业视为推动公共利益的战略伙伴时,可能带来的积极成果

1.12. 展示了我们如何有效利用自身能力,将“大数据”(如地理坐标和时间戳)转化为“大知识”,从而为生活的诸多方面提供情境感知的指引

1.13. 最引人关注的是那些罕见的悲剧性事件,司机因导航系统误导而驶入偏远地区或水域,酿成致命后果

1.14. 在过去20多年里,关于GPS的主流故事并不是讲述其局限性、缺陷和漏洞导致的安全问题和导航等基本服务中断的故事

1.15. GPS在全球范围内,每时每刻、周而复始、年复一年地为人们提供着大量有益的服务

2. 大语言模型

2.1. 应对未来生活的GPS

2.1.1. 你的个人生活导航

2.2. 大语言模型及其衍生的会话智能体功能与此类似,它们增强了我们在庞杂且不断变化的信息环境中导航的能力,这样的环境正是21世纪生活的特征

2.3. 通过提供情境理解能力,这些技术增强了全球范围内个体的能动性,助力我们做出更明智的决策,引导自己去往想去的地方

2.4. 为了推动与自决和广泛参与的理想相符的AI发展,我们必须设计和推广能够优先考虑个体能动性的AI,并确保人们能够以实用和开放的方式运用这些工具

2.5. 大语言模型则是全球学术研究者、大型企业、开源支持者和初创企业共同努力的成果

2.5.1. 以开源、专有或部分开放的形式存在,并通过应用程序接口(API)为开发者提供有限的访问权限

2.6. 大语言模型的输出则是基于人类语言的细微差异、复杂性和主观性

2.7. 虽然大语言模型能处理事实性信息,但并无统一的、客观的“真理”数据库可供其使用,特别是涉及人类知识中更具可解释性的方面时

2.8. 每位大语言模型开发者都在构建一个独特的“信息星球”及其专属地图

2.8.1. 训练数据集不论有多么庞大,也难以覆盖所有信息

2.8.2. 每位开发者都以独特的方式塑造了自己的信息星球

2.8.3. 两位开发者即便使用相同的数据集,也会因参数、权重、算法的差异,以及为使模型符合各自的偏好和价值观而采用不同的微调技术,导致结果迥异

2.8.4. 信息星球显然是人为构建的,与自然形成的物理星球截然不同

2.8.4.1. 地球基本保持恒定,但这些信息星球会随时间的推移而演变,例如通过更新训练技术和引入新数据

2.9. 由于大语言模型是基于统计概率而非固定规则生成输出的,即便是相同的提示(或类比GPS中的“路线请求”),每次输入时都可能会产生不同的结果

2.10. 为了迎合新的信息需求,20世纪涌现了电子邮件、超链接、搜索引擎和表情符号等创新产品和服务,而21世纪则为我们带来了AI

2.11. 大语言模型本质上是用于分析、综合和映射语言流的系统

2.11.1. 与GPS类比,大语言模型就像是无限适用且可扩展的地图,能够引导我们更确定、更高效地从起点抵达终点

2.11.2. 通过提供即时的流畅表达和导航支持,大语言模型成为提升我们在信息世界中的参与度和能力的关键

2.12. 体现了一种民主化的力量,延续了我们在以往技术创新中所观察到的趋势

2.12.1. 博客和社交媒体的出现,让数百万人可以从事过去几乎仅属于职业记者的工作

2.12.2. 像优步和来福车这样的网约车服务,则将一个原本因高昂门槛而受限的行业,转变为数百万人都能轻松参与的行业

2.12.3. 在AI的助力下,那些过去因缺乏技能、培训或资源而无法创作的人,如今也能轻松产出不同类型的文本、插图、计算机代码、音乐和视频

2.12.4. 随着模型不断进化,它们甚至越来越擅长模拟律师、教师、咨询师等专业人士的工作

2.13. 鉴于大语言模型具有广泛的适用性和可扩展性,它们有可能在某种程度上与几乎所有人形成竞争关系

2.13.1. 当你的生计受到这种技术普及的直接冲击时,这种新的现实无疑会让人感到迷茫与痛苦

3. 智能不再稀缺的时代

3.1. 信息、技术的流动传播一直是自我提升的基石

3.2. 由于大语言模型接受了海量数据的训练,它很熟悉各种情境和知识领域中的标准

3.3. 机器智能的可扩展性和适用性进一步提升了其普及程度

3.3.1. 虽然知识已能通过书籍、视频、媒体等各种方式被获取,但拥有专业领域知识的高智力人类仍然有很明显的聚集性

3.3.2. 对于初学者而言,他们将从大模型中获得更大的益处

3.4. 虽然大语言模型不具备人类智能,但人们与其互动时会有与浏览维基百科页面或收听播客时截然不同的体验

3.5. 如同人们从GPS和智能手机中受益一样,最终,社会各阶层的人都将从AI技术中受益

3.6. 大语言模型的媒介转换能力被广泛应用

3.6.1. 多模态大语言模型的服务能力还将继续提升,以帮助视力障碍者“看见”周围的世界

3.6.2. 听障人士也能以类似的方式使用多模态大语言模型

3.6.2.1. AI可以实时且高度精准地转录其他人与他们交谈的内容,同时为他们提供关于说话者语气的背景提示,还能在多人对话的情况下标识说话者的身份

3.6.3. 大语言模型可以将听障人士的手语翻译为音频,以方便不懂手语的听力正常的人理解他们的表达

3.6.4. 大语言模型还具有根据情境识别复杂环境音的能力

3.7. 相比于搜索引擎或维基百科,大语言模型能够更清晰且更容易地收集信息

3.8. 尽管我们认为,在教育、医疗和法律等领域,人类专家与大语言模型协同合作是理想状态,但大语言模型在独立与用户互动时,同样展现出了巨大价值

3.8.1. 它们并非完美无缺,但人类从业者同样也会犯错

3.9. 与人类不同,大语言模型面对用户能即时响应、拥有无限耐心,且始终愿意回答用户提出的额外问题

3.10. 通过自动化与网络化,智能将无处不在,它将与人们在各处相遇,成为几十亿人日常生活中不可或缺的一部分,就像如今的GPS一样

3.10.1. 正如我们在陌生环境中会本能地借助智能手机导航,或在金融交易时依赖GPS精确同步时间,我们也将从根本上利用AI重塑在个人生活与专业领域中进行决策和解决问题的方式

3.10.2. 每个人都将从技术的变革中获益,但对于那些在信息环境中难以有效运用信息的人来说,AI为他们的生活带来的在能力和自由方面的变化将尤其深远

4. 助手

4.1. AutoGPT是一个开源应用,它利用GPT-4来完成一系列有目标导向的任务

4.2. arXiv.org是一个免费开放的资料库,科学家们常在此分享他们尚未正式发表的研究成果

4.3. 目标是利用大语言模型使AI系统可以自主进行长期规划和通过学习自我改进

4.4. 自主AI能同时处理多个复杂任务,几乎无须人工监督

4.4.1. 可以同时处理10件、100件甚至1000件事情,而不是一次只能处理一件

4.4.2. 这种能力可以显著提升人类的生产力,可以并行处理众多具备高价值的任务,因此,具备自主能力的大语言模型对希望扩大自身影响力的企业和个人来说,具有极大的吸引力

4.5. 与大语言模型进行多轮对话仍是发挥其最大价值的关键

4.5.1. 随着大语言模型及其系统越来越强大,它们将能更可靠、更灵活地自主运行,同时,在与用户的一对一持续对话中,它们也将更擅长倾听、互动和遵循指令

4.6. 如果大语言模型产生偏见、有害或其他不良输出,用户可以对其提出质疑或进行纠正

4.6.1. 对即时用户有即时反馈的开放性,使得像ChatGPT这样需要用户动手参与的大语言模型的形态与大多数早期AI的形态截然不同

4.7. AI模型中存在的结构性偏见是一个重要问题,那些受此类偏见严重影响的人通常无法与模型互动并向其反诉偏见带来的伤害,而AI模型中的结构性偏见加剧了这种事态

4.8. 对于对话式AI,情况则有所不同

4.8.1. 部分大语言模型甚至允许你在发出提示前对它们进行预处理,通过自定义指令来明确你的价值观、意图及你期望的回应类型

4.8.1.1. 并非完美无缺

4.9. 使模型更具代表性和包容性是一个持续的改进过程

4.9.1. 与其他媒体和其他形式的AI相比,对话式AI确实为用户提供了前所未有的机会来发挥其影响力

4.9.2. 用户可以引导、启发、告知AI,甚至对其提出质疑,从而重新设定对话的主题与走向

4.10. 用户能以持续且强有力的方式干预AI,再加上大语言模型以其精准映射数据的能力获取的近乎无限的文化知识,使你能够像操控录音室中128轨混音台的专业工程师一样,自如地调节模型的输出方式,并优化模型的输出内容

4.10.1. 不仅有助于减少偏见,还能满足用户众多其他需求和目标

4.10.2. 无论用户以什么样的情感、文化、专业、意识形态或哲学语言与之交流,大语言模型都能就相关内容与用户沟通(尽管流利程度会有所不同)

4.11. 大语言模型不仅加快了人们对特定领域知识的熟悉度,还对此给予了正向反馈

4.12. 自我认知为用户提供了一个起点,助用户开启大语言模型潜在的专业知识宝库

4.13. 与大语言模型交流时,为其提供尽可能多的“坐标”信息会大有益处

4.13.1. 你向大语言模型提供的关于自身定位的信息越详尽,它就越能精准地为你规划前行路径

4.14. 当我们把大语言模型实际运用到个人生活中,其非凡的多样性可以在很多方面助力我们实现目标