网站开发可选的方案有,梅兰商贸网站开发设计简介,建网站的方案,液压电机东莞网站建设1、背景
数据飞轮#xff0c;是今年大模型带火的一个典型词汇#xff0c;通过客户在应用程序中输入的提示词这样的数据反馈#xff0c;使大模型快速迭代。简单说#xff1a;好的产品 - 更多的用户数据 - 更好的模型质量 - 更好的产品就进入了一个正向循环。一…1、背景
数据飞轮是今年大模型带火的一个典型词汇通过客户在应用程序中输入的提示词这样的数据反馈使大模型快速迭代。简单说好的产品 - 更多的用户数据 - 更好的模型质量 - 更好的产品就进入了一个正向循环。一旦我们搭建起了这样的数据飞轮就能在竞争中和对手拉开距离。 图片来自网络 2、案例观点
2.1 Midjourney的数据飞轮产品设计
Midjourney是一款AI绘画工具在Midjourney里面简单到只要打几个字就可以出来质量非常高的照片。
Midjourney产品设计以用户社区作为入门教程、给用户即时反馈以及搭建数据飞轮以迭代模型值得当前的AI应用构建借鉴和参考。
很多人都觉得Midjourney要比开源的Stable Diffusion好上不少这背后有一个很重要的因素就是它拥有更多高质量的标注数据。你可能要问了Midjourney 只有不到 20 个人的团队哪里来的资源去标注数据呢答案就在 Midjourney 的产品设计流程里。
当前的AI内容生成类型的产品普遍存在的一个问题用户其实不知道该怎么玩这个产品这个“不知道怎么玩儿”不是说不知道怎么生成一张图片而是说不知道什么样的提示语值得一试可以画出什么样的场景。因为大部分人和你我一样不太懂得绘画也缺少一些想象力。这样很容易随便画了两三张图片之后就放弃使用 Midjourney 这样的产品了。
下面是Midjourney的几点值得参考的几点设计
设计1默认进入某一个新用户聊天群可以看到其他用户不用的使用场景。这样就可以简单的复制粘贴提示语然后修改几个单词就可以复刻其他人相同风格的画作了。老玩家也有对应的方式
设计2提供优秀的实践案例通过“共享”用户创建的内容这样的方式Midjourney 很容易地让整个社区成为了教会新用户使用产品的通道。而不需要自己费劲费力地去写教程或者提供大量的新手引导功能。ChatGPT缺少这样的能力于是就有了 ShareGPT、FlowGPT 这样分享 ChatGPT 对话内容以及特定、有趣的提示语网站了。
设计3面对响应速度慢问题硬件和计算瓶颈尽可能让用户能在等待过程中可以看到这个任务是有进展的也就是说图片不是一下子从0到100展现出来而是逐步展现如下两张图表示从进度从31%-62%的加载过程减少用户的等待焦虑。和ChatGPT流式输出的效果是类似的图片或视频的处理可能会更复杂。
设计4Midjourney针对用户的输入并不是每次只生成一张图片而是生成了四张不同的图片。因为Diffusion算法生成的图片可控性性比较差一次性拿到用户满意的图片概率比较低。一次性提供四张图片让用户可以从四张里面挑一张显然成功率就高多了。
搭建数据飞轮快速迭代模型
Midjourney拥有更多高质量的标注数据而这些数据绝大部分来自用户的标注或反馈数据。比如每个生成的图片下面有个Favourite按钮代表喜欢和收藏用户点击这个按钮的时候。Midjourney的团队就获得了一个由用户标注好的优质图片数据也就是用户输入的提示词和对应的配对组合。
想象是美好的实际用户主动点击Favourite按钮的会比较少毕竟不是朋友圈类型的社交产品。Midjourney其实还有一些“隐形”的操作也帮助用户标注了图片质量的好坏。
Midjourney 对于任何一个提示语都会生成四张图片。除了直接从四张图片里面选一张放大之外你还可以有另外两个选择。第一个是你可能对四张图片都不满意那么你可以直接点击图片下面的“刷新”按钮重新生成四张图片。或者你对其中一张图片的整体观感还是不错的但是还不够满意。你同样可以点击四格图下方的 V1-V4 按钮中的一个以四格图里面的一张为基础再生成 4 张相似的图片。而对于已经放大了的高清大图用户同样可以点击 Make Variation 的按钮来重新生成 4 张图片再让用户选择。这两个动作里用户尽管没有标记说哪一张图片是好的。但是其实已经告诉了我们哪些图片他并不喜欢以及 4 张图片里哪一张更接近他心目中理想的图片。
而 Midjourney 就可以根据用户前后的一系列操作日志来筛选出那些用户最终选择的图片。如果用户做了大量刷新重新生成或者生成变体的操作并且最后选定了一张图片放大那么这张图片大概率是一张用户满意的高清大图我们不需要依赖用户点击 Favorite 按钮这一动作。
这样的“隐式”反馈在搜索、推荐等应用场景下很常见比如在搜索场景用户输入了搜索词却没有点击任何链接又重新输入了新的搜索词那么大概率表示用户对搜索结果不满意。在短视频的推荐里面尽管用户没有点赞或收藏但是用户看完了整个视频大概率表示用户对视频是感兴趣的。
对于大模型AIGC应用这样“隐式”反馈信息的使用也非常重要。用户反馈越多数据的质量就越高高质量的数据能让我们训练出更好的模型而更好的模型就意味着产品能够生成更高质量的内容吸引更多的用户。这样好的产品 - 更多的用户数据 - 更好的模型质量 - 更好的产品就进入了一个正向循环。一旦我们搭建起了这样的数据飞轮就能在竞争中和对手拉开距离。
用户社区、及时反馈以及建立数据飞轮是 AIGC 类应用必不可少的组成部分。 2.2 火山引擎大模型时代「数据飞轮」怎么做
数据飞轮是今年大模型带火的一个典型词汇通过客户在应用程序中输入的提示词这样的数据反馈使大模型快速迭代。今年初数据飞轮也曾一度被视为 OpenAI 最重要的先发优势。 问题1「用户都看重数据资产不愿意把数据拿出来模型厂商帮助客户训好模型做本地部署做完了『净身出户』数据飞轮很难建立起来」 火山引擎总裁谭待观点 大模型的数据飞轮问题首先要合规其次很多企业愿意与模型厂商共创从而可以让大模型厂商的大模型。 真正有比较好的 AI 原生应用出来可能要等到底座模型本身至少具备GPT3.5以上水平。 问题2怎么理解「以消费为核心」的数据驱动以终为始 火山引擎总裁谭待观点回到最大的根本做这件事情还是希望把目标定清楚最后其实是以数据消费为目标来做这个事情。跟过去五六年业界讲的数据中台的概念相比这是一个更大的升级而且是更有效解决企业数据产生价值的问题。 否则很多企业投入大量的资源建完之后有数据但是没有利用起来本质就是没有想清楚最终应该围绕什么来做这件事情。以前我们做建设的时候目标是有偏差的比如我建一个中台其实不是目标是实现数据驱动的一个手段。 所以我们提出了数据消费、数据飞轮这样的逻辑。企业建设数据时应该把数据消费作为目标比如峰会讲的两个 80%一是 80% 的企业员工能够用到二是能覆盖到 80% 的分析场景。 2.3 数据飞轮汽车行业最新分享营销场景下的7个维度问题解决
数据飞轮是基于字节跳动十余年数据驱动实践经验提炼的企业数智化升级新范式数据飞轮以数据消费为核心驱动能够帮助企业数据流充分融入业务流实现数据资产和业务应用相互促进飞轮效应从而激发员工创造力增强业务发展动力提升组织生命力”。 图片来自网络
部分观点
“数据飞轮本质上是帮助企业更优更快地实现数据驱动”“企业践行数据驱动的三板斧是要通过数据分析厘清需要【做什么】再通过市场画像判断【给谁做】最终通过A/B实现确定【怎么做】“这三板斧中的问题其实都可以通过数据飞轮的运转找到正确答案”“智能是数据飞轮有效转动的最后一公里”火山引擎数据产品负责人郭东东还重点介绍了数据飞轮积极融合包括大模型能力等在内的新技术进展大数据研发治理套件DataLeap-找数助手和开发助手智能数据洞察DataWind-分析助手。
通过对大模型能力的应用DataLeap-找数助手可以帮助汽车企业员在取得授权的条件下通过自然语言问答就能在数据库中找到对应的数据而DataLeap-开发助手则可以帮助员工通过自然语言问答的形式自动生成代码或者修复优化代码进一步降低数据开发门槛。
在使用场景更广泛的数据分析方面DataWind-分析助手支持汽车企业员工仅用自然语言对话就能对数据进行多维度交叉分析和多种形式呈现比如针对实时性较强的跨地域整车销量统计销售岗位的员工只需在DataWInd-分析助手对话框中输入想要获取的数据而无需再等待数据开发、数据分析等跨部门需求响应排期即可获取对应数据省时省力。非技术人员可以快速实现需求满足 参考
极客时间AI大模型之美【27从Midjourney开始探索AI产品的用户体验】大模型时代「数据飞轮」怎么做 | 极客公园数据飞轮汽车行业最新分享营销场景下的7个维度问题解决大模型时代企业如何构建自己的飞轮效应 《飞轮效应》图书吉姆・柯林斯