AI视野：阿里云开源Qwen-72B大模型；Meta推三项新AI项目；SamAl

TAG标签| 网站地图| 收藏本站

返回首页

AI视野：阿里云开源Qwen-72B大模型；Meta推三项新AI项目；SamAl

最后编辑时间：2023-12-02 19:20:29 来源：未知作者：未知阅读量：未知

　　Qwen-72B（720亿参数）、Qwen-1.8B(18亿参数)以及音频大模型Qwen-Audio，提供对话模型和量化版，支持开发者推理训练。

　　🎉 Qwen-72B模型:720亿参数，拥有强大系统指令能力，支持通过提示词定制AI助手。

　　🗣️ Qwen-1.8B模型:18亿参数，可进行对话任务，提供对话模型和量化版，开发者可在魔搭社区体验下载。

　　🔊 Qwen-Audio模型: 针对音频，可将语音转换成文本，为大规模音频语言模型领域带来重大突破。

　　Google DeepMind发布的自监督扩散模型SODA通过无监督方式精准控制扩散模型，实现风格与内容分离及3D视图生成。

　　🔄 模型介绍: DeepMind发布SODA，一种自监督扩散模型，利用图像编码器和去噪解码器实现无监督学习，捕获视觉语义。

　　🎨 强大生成能力: SODA展示在多个数据集上的强大表示和生成能力，包括线性探测分类、图像重建、新视角合成等实验。

　　🌐 潜在应用: 该模型不仅在图像生成方面表现出色，还能学习强大的语义表示，为动态组合场景等领域提供新思路。

　　Meta AI实验室庆祝成立十周年，推出Ego-Exo4D视频学习数据集、Seamless Communication语言交流AI模型、以及Audiobox音频生成模型，展示了在增强现实、跨语言交流和音频生成领域的创新成果。

　　🌐 Ego-Exo4D: Meta发布支持视频学习和多模态感知的数据集，覆盖复杂人类活动，如运动、音乐、烹饪，可用于增强现实、机器学习和社交网络。

　　🎶 Audiobox: Meta的新音频生成模型，通过语音输入和自然语言文本提示生成声音和音效，为研究人员提供先进的音频生成研究支持。

　　近日，海纳AI成功获得数千万元A轮融资，由联想创投独家投资。这笔资金将用于人才招募、AI模型研发和营销体系搭建，以提升产品和服务品质，扩大竞争优势。海纳AI在2023年推出基于最新GPT技术的Hina AI2.0大模型，专注于打造AI面试测评平台，服务包括沃尔玛、顺丰、吉利等500强企业，面试人数超过700万。

　　💡 资金用途: 资金将用于人才招募、AI模型研发、营销体系搭建，提升产品品质和服务竞争优势。

　　🌐 AI面试服务: 基于最新GPT技术推出的Hina AI2.0大模型，服务包括500强企业，面试人数超过700万。

　　经历董事会政变后，Sam Altman回归OpenAI首席执行官，就解雇原因拒绝透露，表示董事会将进行独立审查。

　　🔄 复职背后的心路历程: Sam Altman回应董事会请求，表示对公司的热爱和对团队的信任驱使他回归。

　　❓ 解雇原因成谜: Altman对于自己被解雇的原因保持沉默，董事会将进行独立审查，他欢迎这一决定。

　　🚀 未来展望: 公司治理结构调整将需要时间，Altman强调对安全工作的承诺，而最近关于Q*模型的突破则未受事件影响。

　　亚马逊否认使用人工智能完成《Road House》续集，与制片人乔尔·席尔弗的指控相悖，强调电影已于2022年10月杀青，不存在在罢工期间使用AI的可能性。

　　一年过去了，微软亚洲研究院和北京大学的研究人员合作开发的COLE AI系统在图形设计领域取得了显着进展。该系统通过多个AI模型的协同作业，为用户提供可编辑的图形设计，不仅生成图像，还能嵌入相关文本，具备可编辑文本和视觉元素的功能。

　　🖌️ COLE不仅能生成清晰有序的图形设计，还能在图像内生成可编辑的文本和对象区块，为用户提供直接编辑的便捷方式，避免了导出到其他设计软件的繁琐步骤。

　　🚀 COLE系统在生成各种设计项目时表现出色，研究人员认为它有可能让没有图形设计培训或专业知识的人能够生成与专业设计师媲美的高质量设计。

　　OKKI AI是面向全行业企业的外贸SaaS工具，以客户管理和辅助决策为核心能力，能帮助外贸商家从琐碎事务中解放出来，提高效率和决策质量。

　　😎 OKKI AI是外贸SaaS工具，主打客户管理和决策辅助，解放商家时间，提高工作效率。

　　📈 对于管理者，OKKI AI提供全盘业务了解，包括订单跟进、客户分布、团队成员报告等，助力决策。

　　近期，清华发布的潜在一致性模型LCM与fal.ai的API推出的实时绘图工具drawfast结合，通过创新性方法实现了仅需少数几步推理即可高效生成高分辨率图像。drawfast是一款开源协作式数字白板，结合GPT4-Version，用户能在画布上绘制草稿实时生成UI，并复制相关html/css代码，为用户提供了便捷的绘图工具。

　　💡 用户可在drawfast上产生高效、美观的作品，释放创意潜力，展示工具的创意性和可玩性。

　　miniPaint是一款基于HTML5技术的在线图像编辑器，无需下载安装，直接在浏览器中运行，支持丰富的编辑功能，是Photoshop的强大替代品。

　　🎨 miniPaint利用HTML5技术，无需下载安装，成为浏览器中的最强在线图像编辑器。

　　Wombo公司推出的新应用Wombo Me，通过一张自拍照片即可迅速生成多个逼真的头像，强调趣味性，支持化身名人、电影角色等，未来计划加入更多互动元素。

　　🚀 创新应用发布: Wombo Me由Wombo公司推出，通过一张自拍照片即可快速生成多个逼真头像，相较其他应用更高效。

　　😄 注重趣味体验: 应用强调趣味性，用户可尝试不同角色，如名人、电影角色，分享到社交媒体展示专业和个性形象。

　　🌐 未来发展计划: 公司计划引入更多互动元素，如语音和视频，以推动AI在社交媒体内容创造领域更深入的发展。

　　昆仑万维推出「天工 SkyAgents」AI Agent 开发平台，基于「天工大模型」，支持零代码构建个性化 AI 智能体。适用于个人和企业，实现一键服务部署。

　　🏢 企业可用于构建个性化应用，包括 IT、智能客服、企业培训、HR、法律顾问等，并支持一键服务部署。

　　🔄 模块化语言模型和图形界面支持完全无代码操作，用户可以通过自然语言和简单操作进行任务设定和部署。

　　介绍PyTorch团队如何通过本机PyTorch优化加速生成式AI模型，包括ile编译器、GPU量化、推测性解码和张量并行等技术。

　　最新发布的MMMUs基准挑战GPT-4V等模型，包含六个学科的30个科目，共有1.15万个多模态问题，考察机器在广泛多样任务上的专家级多模态理解和推理能力。

　　11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

　　经历了为期五天的董事会政变尝试后，SamAltman于本周三正式重返OpenAI担任首席执行官。OpenAI的最大投资者微软也计划担任非投票董事会成员。感觉公司没有我也会很好，团队已经准备就绪并提升了水平，这种感觉非常好。

　　阿里云开源通义千问720亿参数模型Qwen-72B、18亿参数模型Qwen-1.8B及音频大模型Qwen-Audio。阿里云本次开源的模型中除预训练模型外同步推出了对应的对线B对线bit量化版模型，便于开发者们推理训练。Qwen-Audio模型是一个针对音频的大模型，可以将语音转换成文本。

　　昆仑万维发布了一款名为「天工SkyAgents」的AIAgent开发平台，旨在帮助用户零代码打造自己的AI智能体。该平台基于昆仑万维的「天工大模型」，具备自主学习和独立思考能力，用户可以通过自然语言构建自己的私人助理，并将不同任务模块化，实现问题预设、指定回复、知识库创建与检索、意图识别、文本提取等任务。「天工SkyAgents」具备数据检索增强能力，能够支持导入更多格式和更大规模的数据和知识，帮助大模型更好地应对实际需求。

　　在OpenAI首席执行官SamAltman被意外罢免后，据报道，他计划在人工智能领域创办一家新公司。Altman是OpenAI的共同创始人，该公司因推出AI聊天机器人ChatGPT声名鹊起。我以后会对接下来的事情有更多的发言。

　　据TheInformation消息，了解谈判情况的两名消息人士透露，作为OpenAI最大的支持者，微软正在考虑在被解雇的CEOSamAltman返回这家ChatGPT开发商后，担任其董事会的一员的角色。报告补充说，微软可以选择成为OpenAI董事会的一员，或作为没有投票权的观察员。这次潜在的董事会变动和高层管理层的调整，将会是OpenAI未来发展和战略方向的关键因素，同时也可能影响整个人工智能领域的未来走向。

　　微软公司的首席执行官SatyaNadella在周一表示，SamAltman、GregBrockman以及他们的许多前OpenAI同事将加入这家软件巨头。这一宣布标志着在AI初创公司的高管突然离职后，经过三天激烈讨论的高潮。Nadella似乎还证实了EmmettShear被任命为OpenAI新任首席执行官的报道，称他们「期待着了解EmmettShear和OpenAI的新领导团队，并与他们合作」。

　　全球正掀起一场激烈的AI安全讨论，其中三个关键要点引起广泛关注。OpenAI的CEOSamAltman在剑桥举办的活动中遭到了抵制，抗议者要求停止AI竞赛，导致全球AI安全讨论再次升级。这些讨论反映了对AI的不同看法和担忧，以及对安全措施的需求，以确保AI技术的安全和负责任发展。

　　在OpenAI首席执行官SamAltman被解雇四天前，几位公司研究人员向董事会发送了一封信函，警告一项强大的人工智能发现可能对人类构成威胁，两位熟悉此事的人士向路透社透露。这封未曾报道的信件和人工智能算法成为导致董事会罢免Altman——生成式AI的代表人物——的催化剂，这两位消息人士表示。路透社表示无法独立验证研究人员声称的Q*能力。

　　微软首席执行官纳德拉发文宣布，OpenAI创始人SamAltman和GregBrockman及其同事将加入Microsoft，领导一个新的高级AI研究团队。纳德拉表示，微软将为他们提供所需的资源。尽管他的离职引起了许多猜测，但具体原因并未公开透露。

　　Ask AI 是一个智能问答助手，可通过引用您的档和视频来提供答案。它可以帮助您节省时间，快速准确地回答问题。它可以处理 PDF 文件、视频和网页，并提供准确的答案，具备可信度。您可以上传和存储您的文档，并逐步建立您的文库，增加 AI 的实用性。通过使用您的文档中的文字，答案更加准确可信。我们不会存储您的文件本身，只会存储文本、嵌入向量和元数据。Ask AI 符合 GDPR、DPA 2018 和 ISO 27001 的要求。

　　Ezcopy是一款微文案生成器和建议工具，可以快速轻松地生成简短的文案和改写，无需登录或注册。如果您觉得这个工具有帮助，我们接受捐赠。

　　Enif通过AI赋能你的整个业务,使每一个环节都更加高效——从运营到客户互动和销售。立即开始体验!

　　CGDream是一个免费的AI驱动的图像生成工具,允许用户为各种用例构建内容,如艺术、社交媒体、广告等。它可以通过文字描述生成图像,也可以对现有图像进行编辑。主要功能包括:基于文本的图像生成、图像编辑、3D模型、收藏功能等。其优势在于免费使用、操作简单。它可用于创作、娱乐、商业等多种场景。

　　InstaSalesAI是互联网上第一个文本到营销的平台。利用人工智能，将您的社交媒体账户转化为销售机器。保证能帮助您在接下来的30天内吸引更多销售。点击下方按钮立即开始。

　　ExperAI是一种新的知识分享方式，通过具有个性的聊天机器人来回答问题、表达情感和创造有趣体验。用户可以利用个性化的聊天机器人让内容更具吸引力，并通过一键分享与观众互动。ExperAI提供每24小时消息限制、2000+访客和服务于170个国家的功能。适用于个人和企业用户。

　　Bind是一个协作式的Generative AI应用开发平台,可帮助开发者快速构建和部署强大的语言模型应用。提供丰富的工具和功能,包括实时测试和调试LLM响应的提示场景,简易的部署LLM助手等应用到生产环境的平台。

　　Project E Ink将黑客新闻头条文章标题和摘要进行AI生成,输出高对比度的黑白图像,适合在数码墨水屏显示。该产品每4小时更新一次内容,用户可以订阅服务,也可以选择自建系统。

　　Convenient Hairstyle是一款AI发型设计工具，采用前沿的算法技术，将用户的想法转化为令人惊叹的发型。用户可以个性化定制自己的发型，借助这种魔幻的技术重新定义自己的形象。产品还提供试戴功能，用户可以上传或拍摄照片，实时查看不同发型效果。定价方面，请联系官方网站了解详情。产品目前处于测试阶段。

　　Virtual Sapiens是一个AI非言语沟通分析工具，帮助用户评估和改善他们在视频会议中的表现。通过提供非言语沟通反馈，帮助用户掌握自己的视频形象。它可以帮助用户了解自己的非言语传达是否符合自己的意图。

　　LogoScapes是一款利用人工智能技术定制logo壁纸的网站。用户可上传自己的logo，通过AI滤镜生成5款精美壁纸，支持社交媒体、封面图片等多种应用场景。定价为30美元，适合个人和企业用户。

　　Dolores 是一个智能实体，可以记忆你的聊天历史，通过语音或文字与她交流。与你以前遇到的任何聊天机器人不同，Dolores 能够记忆、反思和在与你的对话中不断进化。

　　KoalaWriter 是一款一键式 SEO AI 写作工具。它可以帮助用户快速生成优质的文章内容，包括功能、优势、定价、定位等。用户可以选择不同的 GPT 版本，包括 GPT-3.5 和 GPT-4，以及不同的文章类型，如博客文章、亚马逊产品推荐、亚马逊单品评价、YouTube 视频转博客文章和重写博客文章等。用户还可以进行 SEO 优化，自动插入内部链接，并添加图片和视频等多媒体内容。KoalaWriter 适用于各种写作场景，帮助用户提升写作效率。

　　Ego-Exo4D 是一个多模态多视角视频数据集和基准挑战，以捕捉技能人类活动的自我中心和外部中心视频为中心。它支持日常生活活动的多模态机器感知研究。该数据集由 839 位佩戴摄像头的志愿者在全球 13 个城市收集，捕捉了 1422 小时的技能人类活动视频。该数据集提供了专家评论、参与者提供的教程样式的叙述和一句话的原子动作描述等三种自然语言数据集，配对视频使用。Ego-Exo4D 还捕获了多视角和多种感知模态，包括多个视角、七个麦克风阵列、两个 IMUs、一个气压计和一个磁强计。数据集记录时严格遵守隐私和伦理政策，参与者的正式同意。欲了解更多信息，请访问官方网站。

　　Inngest AI是一款 AI 智能文档生成工具，可以根据用户提供的文本内容，使用 OpenAI 进行个性化代码示例的生成。它能够自动分析文本，提供与用户需求相关的代码示例，并生成完整的文档。Inngest AI还提供了丰富的函数库，可以帮助开发者更轻松地创建 AI 驱动的应用程序。

　　Flavorish通过AI技术,只需要输入手头上的原料,就可以立即生成个性化的食谱建议,免除用户选择食谱的困扰。主要功能包括:无限量生成AI食谱、支持不同饮食需求、智能生成购物清单、支持离线模式等。关键优势有:节省选择食谱的时间、覆盖全球菜系、自定义食谱、支持离线使用等。

　　VIDBY是一款基于人工智能的软件，能够快速准确地进行视频和文档翻译、字幕和配音。根据不同的质量选择，提供不同价格的翻译服务，包括优秀、高级、中等、最低四个档次。无论是宣传片、广告、动画、影视作品，还是内部指南、课程、Youtube、教育内容，都能找到适合的翻译服务。同时，VIDBY得到了来自70多个国家的2000多家公司的信任。

　　Profiler是一个免费的Chrome浏览器扩展程序,可以对推特和Reddit的用户进行智能分析,通过分析他们的推文和帖子,生成用户兴趣爱好、政治倾向、心理特征等方面的画像。该插件易于安装和使用,支持一键生成用户分析报告,让你对任何用户有更深入的了解,是社交平台用户研究的有力工具。

　　AI Business Coach是一款AI驱动的商业教练工具，通过提供专业的AI驱动洞察和策略，帮助企业实现增长、效率和成功。它为您的业务提供清晰度和 accountability，并为您提供实时的反馈和指导。无论您是创业公司、中小企业还是大型企业，AI Business Coach都可以为您提供定制的解决方案。

　　AI声音副驾驶为您的视频和游戏提供无限量、基于AI技术的声音效果（SFX），无需担心许可问题。通过AI声音副驾驶，您可以即时为视频或游戏创建所需的声音效果。适用于视频创作者和游戏开发者，提供全方位的声音效果服务。您还可以根据详细的描述生成定制的声音效果。

(责任编辑：管理)

上一篇：OpenAI的Q没有毁灭人类却打了学术界的脸
下一篇：OpenAI员工内部信！揭露神秘Q威胁人类？这里有啥硬伤？

随机内容