Stability AI 发布Stable Diffusion 3 技术报告

Stability AI 发布了他们最强的图片生成模型 Stable Diffusion 3 的技术报告,披露了 SD3 的更多细节。据他们所说,SD3 在排版质量、美学质量和提示词理解上超过了目前所有的开源模型和商业模型,是目前最强的图片生成模型

stable diffusion 2024-03-05 浏览:1368 评论:0

Claude3上线,gpt4领先地位,危!

放大招了,美国时间3月4日晚上10点,Anthropic宣布Claude3上线,全面支持多模态,性能超gpt4,更支持100万tokens的上下文长度(普通用户200k tokens长度)。AI世界的变化日新月异,一不小心,就能被后浪拍到沙滩上。下面是本次更新内容

Claude 2024-03-05 浏览:954 评论:0

1分钟语音即可训练一个自己的TTS模型:GPT-SoVITS!

1分钟语音即可训练一个自己的TTS模型:GPT-SoVITS!根据演示来看,它似乎是目前中文支持比较好的模型试了试,只要 5 秒的数据,它就可以模仿我的声音,更牛的是,一分钟的录音就能训练出高质量的模型,完美克隆声音 YYDS!

AI文本转语音 2024-02-17 浏览:446 评论:0

Sora爆火,普通人的10个赚钱机会

去年,我们见证了AI绘图技术的迅猛发展,其中MJ和SD在国内市场掀起了一股热潮。错过了那波浪潮的你,现在完全有机会借助AI视频制作领域赶上这趟快车。那么对于大众而言,Sora AI视频制作带来了哪些盈利良机?如何抢先占据先机呢?

chatgpt 2024-02-17 浏览:409 评论:0

AI初创公司终结机,openai发布文本转视频产品sora,效果炸裂

北京时间2月16日凌晨,openai正式发布文本转视频产品sora,效果吊打一众同行公司,同行在山姆・奥特曼的推特下评论:

AI行业动态 2024-02-16 浏览:310 评论:0

谷歌发布Gemini 1.5模型

北京时间2月16日,google发布了Gemini 1.5模型,但风头完全被openai的Sora模型的消息压住。实际上,google的Gemini 1.5模型也是非常炸裂,这次最主要的升级是支持了高达 100 万的上下文长度,秒杀了所有模型。Gemini 1.5基于Transformer和MoE架构的研究和工程创新,提高了训练和服务的效率。Gemini 1.5 Pro是一个中等规模的多模态模型,适用于多种任务,并引入了在长上下文理解方面的实验性特性。

Gemini 2024-02-16 浏览:314 评论:0

stable diffusion最新模型Stable Cascade

Stable Cascade 最新模型 快10倍生图、增强审美 优点:免费生图、快10倍,计算时将图像压缩了 42 倍,又能准确重建出大图

stable diffusion 2024-02-15 浏览:440 评论:0

Bard 正式更名为 Gemini

Google 正式将 Bard 更名为 Gemini,同时推出了Gemini Advanced付费会员计划,可以使用Ultra 1.0模型。

Gemini Advanced 现已在 150 多个国家和地区提供英语版本(我尝试升级的时候说我的账号地区不在开放的地区里。。。)

AI行业动态 2024-02-08 浏览:287 评论:0

Midjourney最新消息

昨晚 Midjourney office time 透露的信息有点多:

  1. Alpha 网站下周将会对生成 1000 张图片的用户开放;

  2. V6 马上会升级成 Beta 版本,质量会有校服提升;

  3. 角色一致性的工作会是接下来的重点,会在几周后发布;

  4. V 6.1 可能会增加类似 Controlnet 的功能;

midjouney 2024-02-08 浏览:369 评论:0

Arc 浏览器 CEO关于后 URL 时代(人工智能时代)的互联网畅想

Josh Miller(Arc 浏览器 CEO)这个关于后 URL 时代(人工智能时代)的互联网畅想有点意思,Arc 最近的更新应该就是以这个判断进行的。#ai# (https://m.weibo.cn/search?containerid=231522type=1%26t=10%26q=#ai#&isnewpage=1)这个东西可能很多人都想过,很早就有人提出来未来的 UI 会是一个对话页面加上各种匹配数据展示样式的组件来完成,Josh Miller这个更近一步解决了内容来源的问题

AI行业动态 2024-02-08 浏览:287 评论:0