АйТиБорода
20.7K subscribers
217 photos
32 videos
7 files
1.15K links
Авторский by @iamitbeard. Про IT, технологии и ИИ; без цензуры и политстирильности. Чат @itbeard_talk

Слава Україні. Жыве Беларусь.

АйТиБорода: https://youtube.com/itbeard
Эволюция Кода: https://web.tribute.tg/l/ge
AIA Podcast: https://itbeard.com/aia
Download Telegram
Нет, это не я. Нет, это не переозвученный я. Это результат работы цифрового аватара HeyGen. Это созданный мною с нуля аватар, и его качество поражает. Дальше расскажу, как я это сделал.

Сервис HeyGen позволяет переозвучивать видео и делать цифровые аватары. Для теста я купил подписку уровня "Creator" за вполне подъемные 59$ в месяц. С ней вы можете создавать до 30 минут script-to-video в месяц. Script-to-video - это когда ты пишешь дословный сценарий, а твой аватар его озвучивает. Не путать с text-to-video, это другое.

Дальше я снял несколько референсных (исходных) видео, на базе которых был создан аватар. Пример референсного видео - третий из поста. Сидишь и пару минут говоришь на камеру в своей манере. Главное быть естественным и говорить на одном языке (любом). На основе этого видео HeyGen довольно шустро делает аватар, который уже и используется для script-to-video.

В референсном видео из этого поста у меня звук с петли Rode Wireless Pro. Звук у петли хороший, но для качественной реплики он не подошел - то что выдал HeyGen не было похоже на мой голос. Потому я на скорую снял видео для второго автара, в котором не парился с качеством картинки, но голос записал на профессиональный микрофон Shure sm7b. В итоге получилось очень похоже на меня. В сервисе вы можете миксовать голоса разных аватаров, тут нет проблем.

И ещё из важного - это "файнтьюнинг". Для качественного результата надо снимать референсное видео на хорошую камеру и с хорошим светом. Второе видео из поста - результат работы аватара без "файнтьюнинга". На нём у меня и борода рассыпается, и рот не так круто выглядит, как мог бы. Процесс файнтьюнинга в HeyGen - это когда ты доплачиваешь 49$ и ждешь 12 часов. Такой себе "файнтьюнинг", но результат после него действительно лучше. Борода не рассыпается, рот и зубы проработаны чётче.

В общем, я очень под впечатлением. Буквально за 110$ вы получаете идеального аватара, разговаривающего на 10+ языках. Скоро сделаю целый видос, где буду полностью заменен аватаром, следите за обновлениями 😎
#ai
Через 15 минут стартует ежегодная конференция Цукерберга - "Meta Connect 2023".

Конфа будет идти два дня, и на ней будет два очень важных топика: VR и AI.

Так как Meta дефакто (пока ещё) является лидером в мире метавеёрса и VR со своими шлемами Quest, очень интересно узнать, какой же по итогу будет Quest 3, и изменят ли они его характеристики из-за выхода на рынок шлемофонов от Apple.

В части ИИ много чего будут рассказывать про LLaMa, тут Meta тоже заняла лидирующую позицию, так как утёрли нос всем остальным open-source LLMкам. Надеюсь, что побольше расскажут про свою новую LLMку, которая должна выйти уже вот вот и чуть ли не стать конкурентом ещё не вышедшего GPT-5.

👉 Расписание тут: https://www.metaconnect.com/en/agenda
👉 Смотреть трансляцию можно на FB (увы): https://www.facebook.com/Meta
Вопрос для любителей научпопа: знаете такого биолога Александра Панчина?
Так вот Артем Малышев запилил с ним офлайн-интервью на Anywhere Club: https://youtu.be/RrtSQMnkikA

Будет что вам посмотреть перед завтрашним крутейшим релизом на АйТиБороде (программирование и объявление очень интересной активности) 😊
Forwarded from addmeto (Grigory Bakunov)
У Фридмана вышло первое чисто виртуальное интервью с Цукербергом. Посмотрите хотя бы ради картинки, по сути это встреча в метаверсе с помощью Quest Pro. Выглядит очень круто, еще 3-5 лет, и изображение будет не отличить от реального мира.

https://www.youtube.com/watch?v=MVYrJJNdrEg
#материалы из выпуска про программирование Web3

🔸 HACK-TON-BERFEST 2023: https://bit.ly/hack-ton
🔸 Похакатонить с Лексом: @itbeard_in_ton
🔸 Канал Вовы: https://www.youtube.com/@alefman_vladimir

Ссылки
🔹 TON Foundation: https://ton.org/
🔹 Про гранты TON: https://ton.org/grants
🔹 Русскоязычное TON-комьюнити: https://t.me/tondev
🔹 Англоязычное TON-комьюнити 1: https://t.me/tondev_eng
🔹 Англоязычное TON-комьюнити 2: https://t.me/tactlang

Книги
🔸 Алексей Вторников: “Стек, или Путешествие туда и обратно”
🔥 Новый выпуск про языки программирования Fift, FunC, Tact, Solidity, про Web3 и блокчейн TON уже на канале!

Сегодня вас ждёт хардкорный выпуск про блокчейн-разработку: на каких языках программирования создают смарт-контракты и что это такое, как работают нодовые виртуальные машины, чем отличается асинхронщина в TON от синхронного кода в Ethereum, есть ли место ООП и функциональщине в мире смарт-контрактов, что за frontend & backend у крипто-проектов, что такое dApp, Web3 и децентрализованный интернет. Гость выпуска Вова Алефман, Fullstack Blockchain Developer.

А ближе к концу выпуска вас ждёт сюрприз: приглашение от меня попрограммировать вместе в рамках "HACK-TON-BERFEST 2023” и перенести АйТиБороду в децентрализованный мир блокчейна TON 😎

👉 YouTube: https://youtu.be/a3Jyy-z4Kmo
👉 Apple Podcasts: https://apple.co/41hwOIQ
👉 Google Podcasts: https://bit.ly/itbeard-googlepodcasts
👉 Spotify: https://spoti.fi/3Ktbf1Y
👉 Скачать mp3: https://podcast.itbeard.com/e/180

Приятного просмотра и прослушивания, увидимся на хакатоне ❤️
Forwarded from Влад Тен
Привет, меня зовут Влад. Я из Узбекистана
Сейчас работаю разработчиком в Microsoft
Также, вы могли меня видеть на YouTube

https://www.youtube.com/results?search_query=Влад+Тен

Если вы чувствуете, что потеряли смысл в своей работе как разработчик или просто запутались, я предлагаю вам следующее:
Сделайте донат в размере 50$ в любую аккредитованную благотворительную организацию, занимающуюся борьбой с детским раком и после этого мы проведем 40-минутную сессию (вы не переводите деньги мне, а просто подтверждаете ваш донат).

Отчет о собранной сумме, а также каждый скриншот и отзыв, будут опубликованы с упоминанием вашего профиля LinkedIn

В рамках этих сессий я предлагаю:

* Карьерные консультации
* Мок-интервью
* Помощь в составлении резюме и поиске работы
* Составление плана развития (Roadmap)
* Развитие личного бренда
* Spotlight на моем ютуб и телеграм канале
* Ну или просто вы хотите пообщаться за жизнь

https://www.youtube.com/results?search_query=Влад+Тен

Забронировать сессию можно отправив подтвержденный платеж и свой телеграм на vlad010694@gmail.com
Пожалуйста поставьте темой письма | 10 Bits - Ваше имя
По поводу поста выше: Влад Тен тот самый парень из Microsoft, который круто решает Литкод и может прокачать вас за благотворительный донат 🙂

P.S. А ещё можно закинуть буст каналу, чтобы увидеть мой фейс в сториз со спойлерами контента. Осталось 12 штук всего 😉
Я там пару дней назад рекомендовал канал про ИИ от земляка, а сегодня там вышла реклама митапа ВК. Удивлен и расстроен как и вы, беру назад рекомендацию, пост удалён.

Одно дело рекламировать независимые митапы или комьюнити-митапы (тут ну хотя бы нет прямой связи с преступным режимом, хотя я сам и такое рекламировать не стал бы, вы меня знаете). Другое дело рекламить что-то от мусорской компании ВК и прочих мудаческих крупных "игроков рынка".

При этом это вообще не значит, что канал плохой с точки зрения контента, с этим гуд, человек высокий спец. Но прикрывать хорошим контентом невежество в темах, в которых вроде уже можно было разобраться за два года - зашквар, как мне кажется.
В новой точке обсуждают блокировку протокола WireGuard в рф, Миша Климарёв @zatelecom прям хорошо расписал чего ждать дальше: https://www.youtube.com/live/9WgQZTzdg6g

Вообще, Точка прям неплохо даёт новости про IT-актуалочку ru-региона, за которым полезно присматривать. Единственное, не понимаю зачем туда зовут Кушелева, который гордо носит имя главы техпиара фсбшной кормушки - Яндекса.

P.S. В выпуске две жирнющие отсылки к следующему выпуску АйТиБороды, вот такой вам спойлер.
На канале "Цёмны Лёс" вышел почти классический выпуск АйТиБороды про Искусственный Интеллект простыми (нет) словами.

Вместе с Machine Learning инженером Димой Сыроквашем мы говорим про устройство современных нейросетей, про самосознание и безопасность ИИ, про Alignment и проблемы этики.

Так что, если понимаешь беларуский язык, то ставь лайкос и го смотреть и слушать! 😊

👉 YouTube: https://youtu.be/EudlXMwQR_4
👉 Google Podcasts: https://bit.ly/ciomnylos-google
👉 Apple Podcasts: https://apple.co/3ZqIeYJ
👉 Spotify: https://spoti.fi/3mc5Thl
👉 Скачать mp3: https://ciomnylos.itbeard.com/e/23
А ещё в Ютуб вернулся Илья Климов с отличным обзором того, что робіцца в IT-индустрии: https://youtu.be/eGFH8Jhb2Nk

Не знаю, надолго ли Ильюха вернулся, но выдал базу 👍
Есть две вещи из сферы AI, за которые Гуглу не прилетает хейт: разработки Deep Mind и телефоны Google Pixel. И вот последний презентовали буквально пару часов назад на ивенте "Made By Googl 23": https://www.youtube.com/live/R7Kvb8FDjG4

Там показали много новых продуктов, в каждом из которых сидят какие-то сервисы на нейронках или новые фичи связанны с ИИ - не жалко потратить час на просмотр. Но отвечу на главный вопрос: Google Pixel 8 Pro надо брать.

Сам я владелец Pixel 7 Pro, и честно до последнего в презентации думал, что не стоит мне обновляться, ну добавили пару инструментов в камеру, завязанных на новый проц G3, переживу без них. Но в конце представили киллер-фичу - Google Pixel 8 Pro будет запускать генеративные нейронки ПРЯМО НА ДЕВАЙСЕ! LLMки и Diffusion модельки будут крутиться вот прямо на новом процессоре. Это по идее первый телефон, который запускает полноценные GenAI на себе без хождения в облака. И Гугл делает на это большую ставку, так как еще и расширил софтварную поддержку Pixel 8 с 2х до 7 лет, что конская цифра. Для сравнения, модели на Pixel 7 слабее в 150 раз по вычислительным способностям: чем то, что на 8 Pro.

Что это нам даёт? Да дахрелион всего. Начиная от голосового ассистента, который будет вместо вас говорить БЕЗ ЗАДЕРЖЕК со звонящими спамерами (здарова мусара) и заканчивая ИИ-зумом (ага, не оптика и не цифра, а ИИ), работающим без интернета, или офлайн-самаризатором диктофонной записи вашего митоса. Применений реально дахрелион, железо готово.

Красиво, короче. С пикселями Гугл утирает нос многим, и даже Эплу. Потому думаю, что обновлюсь через пару месяцев. Ну а если вы думали какой Пиксель брать, то теперь ответ однозначный - 8 Pro. Все предыдущие модели - уже прошлый век.
🤖 Я вам обещал сделать целый выпуск через HeyGen? Ну вот ловите: https://youtu.be/4qxgYkptAKw

Делал по следам конференции "Made by Google '23", в две генерации по 2 минуты. Оказывается, что если HeyGen генерирует видео длиннее референсного (на котором обучался), то на отрезке превышающем длину референса аватар начинает очень неестественно двигаться и моргать, потому две генрации, а не одна. К тому же генерация одного и того же видео отличается от раза к разу, первая вообще не понравилась, потому по факту было три генерации по несколько минут.

Еще, я попробовал сделать платный клон голоса. Качество вроде улучшилось по сравнению с предыдущими генерациями. Для обучения пришлось пять минут начитывать английский текст на ломаном языке.

Текст для видео делался через ChatGPT по моим скудным заметкам с конфренции. Бэкграунд обложки рисовал бесплатный инстанс SDXL на JAX и Google Cloud TPU. Тайтл и описание ролика - совместная работа ChatGPT и меня.

Итоговый ролик отмонтажен за пару часов в Premier Pro. Теперь я точно знаю, что аватары не заменят авторов на ютубе полностью, так как кроме съёмок остается ещё куча рутины по монтажу, спим спокойно. Но на английском он говорит прям сильно лучше меня, это факт 😅

#ai
Вчера пол ночи тестировал DALL-E - нейросеть от OpenAI, которая по идее должна стать конкурентом Midjourney 5 и Stable Diffusion XL. По итогу могу сказать, что в фотореалистичную графику она умеет сильно хуже, но вот логотипы и анимационную графику рисует прям круто.

Основной упор в DALL-E сделан на понимание промптов и написание текста. Как итог, не нужно выдумывать миллион слов описания чего ты хочешь, и текст пишется правильно.

Я нагенерил около 100 вариантов логотипа для АйТиБороды по промпту "logo for an IT channel called "ITBEARD" with a bald man with round black sunglasses, in blue and white colors with dark background without text", и парочка вышли настолько удачными, что потратив пару часов на доведение в фотошопе я получил новое лого канала.

👉 Протестить DALL-E можно тут: https://www.bing.com/images/create
#ai
⚡️ AIA Podcast №18 уже на всех платформах!

Сегодня
делимся впечатлениями от HeyGen и DALL-E 3, обсуждаем итоги конференций "Made by Google '23" и "Meta Connect 2023", говорим про AI-железки для памяти и для взрослых, про новинки ChatGPT, не доверяем роботу от Теслы, обсуждаем ИИ-буллинг и восхищаемся первым интервью в виртуальной реальности.

👉 YouTube: https://youtu.be/ldmr9aeb4co
👉 Google Podcasts: https://bit.ly/aia-google
👉 Apple Podcasts: https://bit.ly/aia-apple
👉 Spotify: https://bit.ly/aia-spotify
👉 Скачать mp3: https://aia.simplecast.com/episodes/18

А ещё мы создали телеграм-чатик для слушателей AIA Podcasts, где будем скидывать новости ИИ и общаться, залетайте @aiapodcast 😎