摘要: 论文探讨了在时尚行业中应用大型语言模型(LLMs)和生成智能(GI)技术,这些技术通过加速设计开发、个性化产品和增强客户互动,为时尚行业带来了独特的机会。研究提出了一种结合LLMs和GI的优势与人类创造力的混合智能模型,以解决这些挑战并优化设计流程。
研究背景: 时尚行业以其创新和快速采用新技术而闻名。LLMs和GI在时尚设计、产品个性化和客户互动方面提供了新的可能性,但也存在挑战,尤其是在处理复杂的空间参数和设计细节方面。
主要贡献:
提出了一种新的混合智能模型,该模型结合了LLMs和GI的优势与人类创造力。通过实验验证了所提出方法在视觉质量和视觉缺陷指标上的显著改进。该方法简单、无需训练、适用于不同的LLMs,并通过直接检查选定的令牌序列增强了可解释性。研究方法: 研究者提出了一种名为GemFilter的方法,它在LLMs的早期层使用过滤器来选择和压缩输入令牌,从而显著减少了后续处理所需的上下文长度。此外,研究者还引入了一种新颖的细节保持器,通过任务切换器允许模型在生成注释或重建输入图像之间切换。
实验结果: GemFilter在多个基准测试中表现出色,包括在“Needle in a Haystack”任务中的表现,以及在LongBench多任务基准测试中与SnapKV/H2O相当的性能。此外,GemFilter在减少输入令牌长度的同时,对模型性能的影响最小。
结论: GemFilter通过利用LLMs早期层的能力来识别相关信息,为长上下文输入的LLMs推理提供了一种加速方法。这种方法不仅提高了推理速度和内存效率,而且通过直接检查选定的令牌序列,增强了模型的可解释性。
一句话总结: 这篇论文提出了一种结合生成模型和混合智能的新方法,通过在时尚行业中应用GemFilter,显著提高了设计流程的效率和质量,同时增强了人工智能在创意过程中的作用。
论文链接https://www.frontiersin.org/journals/artificial-intelligence/articles/10.3389/frai.2024.1460217/full