Более 100 ML проектов

Pic MLBit
  1. Heart Disease Prediction (Прогноз болезни сердца)
  2. Skin cancer Detection (Обнаружение рака кожи)
  3. Uber Data Analysis Project (Проект анализа данных Uber)
  4. Automatic License Number Plate Recognition Project (Проект автоматического распознавания номерных знаков)
  5. Image Classification (Классификация изображений)
  6. Metacat: Making Big Data Discoverable and Meaningful at Netflix (Code) Netflix (Metacat: сделать большие данные доступными и значимыми в Netflix (код) Netflix)
  7. DataHub: A Generalized Metadata Search & Discovery Tool (Code) LinkedIn (DataHub: универсальный инструмент поиска и обнаружения метаданных (код) LinkedIn)
  8. DataHub: Popular Metadata Architectures Explained LinkedIn (DataHub: популярные архитектуры метаданных LinkedIn)
  9. How We Improved Data Discovery for Data Scientists at Spotify Spotify (Как мы улучшили обнаружение данных для специалистов по данным в Spotify Spotify)
  10. How We’re Solving Data Discovery Challenges at Shopify Shopify (Как мы решаем проблемы обнаружения данных в Shopify Shopify)
  11. Nemo: Data discovery at Facebook Facebook (Nemo: открытие данных в Facebook Facebook)
  12. Apache Atlas: Data Goverance and Metadata Framework for Hadoop(Code) Apache (Атлас Apache: структура управления данными и метаданных для Hadoop (код) Apache)
  13. Collect, Aggregate, and Visualize a Data Ecosystem’s Metadata (Code) WeWork (Сбор, агрегирование и визуализация метаданных (кода) экосистемы данных WeWork)
  14. Amundsen — Lyft’s Data Discovery & Metadata Engine Lyft (Амундсен – Lyft по обнаружению данных и движку метаданных Lyft)
  15. Open Sourcing Amundsen: A Data Discovery And Metadata Platform(Code) Lyft (Открытый исходный код Амундсена: платформа для обнаружения данных и метаданных (код) Lyft)
  16. Time Series Forecasting with ARIMA Model (Прогнозирование временных рядов с помощью модели ARIMA)
  17. Stock Price Prediction Project (Проект прогнозирования цен на акции)
  18. Fake News Detection Model (Модель обнаружения фейковых новостей)
  19. Driver Drowsiness Detection System with OpenCV & Keras (Система обнаружения сонливости водителя с OpenCV и Keras)
  20. Open-Sourcing Riskquant, a Library for Quantifying Risk (Code) NetFlix (Open-Sourcing Riskquant, библиотека для количественной оценки риска (кода) NetFlix)
  21. Automatic Forecasting using Prophet, Databricks, Delta Lake and MLflow (Paper, Code) Atlassian (Автоматическое прогнозирование с использованием Prophet, Databricks, Delta Lake и MLflow (Paper, Code) Atlassian)
  22. Image Classification with Artificial Neural Networks (Классификация изображений с помощью искусственных нейронных сетей)
  23. Binary Classification Model (Модель двоичной классификации)
  24. Fake News Detection Project (Проект обнаружения фейковых новостей)
  25. Data Augmentation with Deep Learning (Увеличение данных с помощью глубокого обучения)
  26. Yelp Personalized Reviews (Персонализированные обзоры Yelp)
  27. Landmark Recognition Using Machine Learning (Распознавание ориентиров с помощью машинного обучения)
  28. CarveML- fragment classification (CarveML – классификация фрагментов)
  29. Augment Sentiment Analysis using Machine Learning (Анализ настроений с помощью машинного обучения)
  30. Analyz Vocal Patterns to Determine Emotion using Machine Learning (Анализируйте голосовые паттерны для определения эмоций с помощью машинного обучения)
  31. Predict the Commercial Success of Songs Based on Lyrics (Прогнозируйте коммерческий успех песен на основе текста)
  32. Aircraft Conceptual Design using Machine Learning (Концептуальный дизайн самолета с использованием машинного обучения)
  33. Extract Word Relationships using Machine Learning (Извлечение словесных отношений с помощью машинного обучения)
  34. Predict Delayed Onset Trauma — Ischemic Stroke Machine Learning (Прогнозирование травмы с отсроченным началом – машинное обучение ишемического инсульта)
  35. Classify Online User Behavior using Machine Learning (Классифицируйте поведение пользователей в Интернете с помощью машинного обучения)
  36. Real Time Flight Path Optimization using Machine Learning (Оптимизация траектории полета в реальном времени с помощью машинного обучения)
  37. Sign Language Recognition Project (Проект распознавания жестового языка)
  38. Image Segmentation (Сегментация изображений)
  39. XGBoost Algorithm (Алгоритм XGBoost)
  40. Face Landmarks Detection (Обнаружение ориентиров на лицах)
  41. Used Car Price Prediction (Прогноз цен на подержанные автомобили)
  42. Loan Defaulter Prediction Machine Learning (Машинное обучение для прогнозирования неплательщиков ссуд)
  43. Uber Trips Analysis (Анализ поездок Uber)
  44. Loan Eligibility Prediction Python Machine Learning (Прогнозирование приемлемости ссуды Машинное обучение Python)
  45. WhatsApp Chats Analysis (Анализ чатов WhatsApp)
  46. Covid-19 Vaccine Analysis (Анализ вакцины Covid-19)
  47. Student Grades Prediction Model (Модель прогнозирования оценок учащихся)
  48. Live Face Mask Detection Project in Machine Learning (Проект масок в реальном времени в машинном обучении)
  49. GDMix: A Deep Ranking Personalization Framework (Code) LinkedIn (GDMix: платформа персонализации глубокого ранжирования (код) LinkedIn)
  50. Data Science Project on Area and Population (Проект по науке о данных по площади и населению)
  51. A Complete Machine Learning Project Walkthrough (Полное пошаговое руководство по проекту машинного обучения)
  52. Movie Recommendation (Рекомендация фильмов)
  53. Data Science Project on Birth Rate Analysis (Data Science Project по анализу рождаемости)
  54. Data Science Project on Time Series (Проект Data Science по временным рядам)
  55. Crime Data Analysis (Анализ данных о преступности)
  56. Data Science Project on Time Series (Проект Data Science по временным рядам)
  57. Keyword Extraction (Извлечение ключевых слов)
  58. Multiple Disease Prediction (Прогнозирование множественных заболеваний)
  59. Multiple Disease Prediction — Part 2 (Прогнозирование множественных заболеваний – Часть 2)
  60. Text Summarization (Обобщение текста)
  61. Keyword Extraction (Извлечение ключевых слов)
  62. Amazon Search: The Joy of Ranking Products (Paper, Video, Code) Amazon (Amazon Search: радость ранжирования продуктов (бумага, видео, код) Amazon)
  63. Driver Distraction Prediction Using Deep Learning (Прогнозирование отвлечения внимания водителя с использованием глубокого обучения)
  64. Area and Population (Площадь и население)
  65. A Complete Machine Learning Project Walkthrough (Полное пошаговое руководство по проекту машинного обучения)
  66. Text Summarization (Обобщение текста)
  67. Fake News Detection using Machine Learning (Обнаружение фейковых новостей с помощью машинного обучения)
  68. Image Recognition (Распознавание изображений)
  69. Gender Classification Model (Модель гендерной классификации)
  70. Daily Births Forecasting (Ежедневное прогнозирование рождений)
  71. Modeling Conversion Rates and Saving Millions Using Kaplan-Meier and Gamma Distributions (Code) (Моделирование коэффициентов конверсии и сбережения миллионов с использованием распределений Каплана-Мейера и гамма-распределения)
  72. Fake Product Review Detection (Обнаружение фальшивых отзывов о продукте)
  73. Click-Through Rate Prediction Model (Модель прогнозирования рейтинга кликов)
  74. Interactive Language Translator (Интерактивный переводчик языков)
  75. Customer Segmentation Project (Проект сегментации клиентов)
  76. Language Detection (Определение языка)
  77. Streaming Service (Потоковый сервис)
  78. Stock Price Prediction (Прогноз цен на акции)
  79. President Heights (Рост президентов)
  80. Black Friday Sales Prediction (Прогноз продаж на Черную пятницу)
  81. Diabetes Prediction (Прогнозирование диабета)
  82. Google Search Analysis (Анализ поиска Google)
  83. Meet Wasabi, an Open Source A/B Testing Platform (Code) Intuit (Встречайте Васаби, платформу для A / B-тестирования с открытым исходным кодом (код) Intuit)
  84. Tesla Stock Price Prediction Model (Модель прогнозирования цен на акции Tesla)
  85. Financial Budget Analysis (Анализ финансового бюджета)
  86. Learning Gladiator (Изучение гладиатора)
  87. Play Money Ball (Играть в денежный шар)
  88. Network Security Analysis (Анализ сетевой безопасности)
  89. Bar Chart Race (Гистограмма гонки)
  90. Keyword Research (Исследование ключевых слов)
  91. Fashion Recommendation System (Система рекомендаций по моде)
  92. Face Detection (Распознавание лиц)
  93. Emotion Detection Model (Модель обнаружения эмоций)
  94. Telegram Bot (Телеграм бот)
  95. Machine Learning Baseball (Машинное обучение бейсбол)
  96. Predict Stock Prices (Прогнозировать цены на акции)
  97. Stock Price Predictor (Предиктор цен на акции)
  98. Titanic Survival Analysis (Анализ выживания на Титанике)
  99. Deep Learning to Translate Between Programming Languages (Paper, Code) Facebook (Глубокое обучение для перевода между языками программирования (бумага, код) Facebook)
  100. Galaxy Classification (Классификация галактик)
  101. Time Series with LSTM Model (Временные ряды с моделью LSTM)
  102. Image Classification with TensorFlow (Классификация изображений с помощью TensorFlow)
  103. Predict Weather (Прогноз погоды)
  104. Handwritten Text Recognition with TensorFlow (Распознавание рукописного текста с помощью TensorFlow)
  105. Handwriting Recognition (Распознавание почерка)
  106. Visualize a Solar System (Визуализируйте солнечную систему)
  107. Hate Speech Detection Model (Модель выявления языка вражды)
  108. Build Instagram Filters (Создавайте фильтры Instagram)
  109. Contact Tracing (Отслеживание контактов)
  110. Deploy a Chatbot (Развернуть чат-бота)
  111. Summarize Text (Суммировать текст)
  112. PEGASUS: A State-of-the-Art Model for Abstractive Text Summarization(Paper, Code) Google (PEGASUS: современная модель обобщения абстрактного текста (бумага, код) Google
  113. GeDi: A Powerful New Method for Controlling Language Models(Paper, Code) Salesforce (GeDi: новый мощный метод управления языковыми моделями (бумага, код) Salesforce)
  114. Language Classification (Классификация языков)
  115. OTP Verification GUI (Графический интерфейс проверки OTP)
  116. Create an Audiobook (Создать аудиокнигу
  117. Investigate Enron Fraud Analysis (Изучите анализ мошенничества Enron)
  118. Computer Vision (Компьютерное зрение)
  119. Diamonds Analysis (Анализ алмазов)
  120. Image GPT (Paper, Code) OpenAI (Изображение GPT (бумага, код) OpenAI)
  121. Text Classification with TensorFlow (Классификация текста с помощью TensorFlow)
  122. Image Segmentation (Сегментация изображений)
  123. Ridge and Lasso Regression (Регрессия хребта и лассо)
  124. Announcing ScaNN: Efficient Vector Similarity Search (Paper, Code) Google (Представляем ScaNN: эффективный поиск по сходству векторов (бумага, код) Google)
  125. Image Cartoonifier (Мультипликатор изображений)
  126. Predict Fuel Efficiency (Прогнозировать эффективность использования топлива
  127. ABC Analysis with Python (ABC-анализ с помощью Python)
  128. Lung Segmentation (Сегментация легких)
  129. Handwritten Digit Recognition Project (Проект распознавания рукописных цифр)
  130. RFM Analysis with Python (RFM-анализ с помощью Python)

И ещё больше всего: источник

Больше спишь больше выучишь

Powered by Journey Diary.

Few Clouds, -7°C

Бескудниковский б-р, 34, Москва, Россия, 107031

1 The Pearl by Steinbeck, 88 pages
2 The lion, the witch and the Wardrobe by C.S. Lewis, 188 pages, fantasy, available as a movie
3 Ender’s Game by Orson Scott Card, sci-fi, 209 pages, available as a movie
4 The Hitchhikers Guide To The Galaxy by Douglas Adams, sci-fi, 252 pages, available as a movie
5 Life of Pi by Yann Martel, 356 pages, available as a movie
6 The Firm by John Grishnam, available as a movie

YouTube video: https://youtu.be/17NDnbHBKLg

Powered by Journey Diary.

Вступление

TPU – сокращает время на обучение ИИ в 100 раз (интегрированный с гугл клауд)
TPU – tensor processing unit
Project BrainWawe (Microsoft)

Now AI is used in 3 bn+ devices
voice assistants, by 2023 this number will gromw to 8 bn, which is comparable to the Earth’s population

Замедление темпов разработки в связи с гео

1 bn investment in OpenAi for development of Artificial General Intelligence (AGI)
Allen Institute for AI

DeepMind – Starcraft 2 AI vs Human today outperforms 99.8% players on Battle.net

AI Legacy – низкий уровень использования ИИ
AI Ready – точечное использование ИИ для преобразования ключевых процессов
AI Native – системное использование ИИ для преобразования всех процессов


Первый Спикер

Люди начали считать раньше чем начали что-то записывать
В 1949 считалось что самая большая библиотека 12500 Мб

2018 год

33
000 000
000 000
000 000
000 Мбайт

1960 Idea > 1999 SaaS SalesForce > 2002 1 IaaS Amazon -> 20?? MS Azure

AI Cloud

!!!!! INSIGHT !!!!!
MY INTERESTING MAIL – Binary or Multi Classications for mail themes and meil text and pictures
!!!!! INSIGHT !!!!!

Cristofari – гордость Сбербанка 6,67 PFLOPSi
SberCloud.ru
5750 rub / min

Уникальное предложение 100 рублей 100 минут 100 часов на 10 гб, подробнее на SberCloud.ru

Сбербанк 178 лет!

10 000 рублей всем участникам AI Journey на SberCloud.ru


Пользоваться всем набором BI инструментов

Это доступно каждому! 

Говорят в Сбере: 

Если не используешь данные BI, то ты уже позади


LSTM 

Google 

Facebook

Все используют LSTM – Long 

Глубинное обучение началось в СССР  в 1965 Иваненко и Лапа (Украина)

Они работали над нейросетями, которые учились. Технология довольно старая. 

1991 – RNN – используют более мощную нейронную сеть с фидбек коннекторами

Миллион операций за ту же цену.

Распознавание 

DeepMind – умеет играть в игры, основатели DeepMind студенты этого спикера.

Open AI Five – LSTM собирает данные на основании экспериметов в результате которой учится система. 

Ребёнок становится маленьким ученым, проводя маленькие эксперементы. Художники искуственного интелекта учатся сами создавать.

Что будет дальше?

В будующем будет что-то чего уже нет. Основные доходы маркетинг и продажа рекламы – большие компании. Основная тема: спрогнозировать что вы хотите сделать дальше.

Маленький ученый. Маленький робот. 3,5 миллиарда лет ушло на то чтобы получилась маленькая обезьянка.

Человеческая Эволюция может произойти быстрее чем Биологическая

nnaisense <– компания 

FESTO 

Hannover Messe 2019

EOS – искусственный интеллект в 3d печати

Темы для искуственного интелекта:

робот который будет сам устанавливать цели и понимать мир, возьмите старые концепты и используйте новые метожы продвижения этих концептов

в этой области будут большие прорывы, студенты математики смогу организовать следующую революцию


HUAWEY

Если искуственный интелект будет развиваться быстрее чем ICT оборудования, то начнётся зима искуственного интелекта

Искуственному интелекту нужно развиться

5G Huawai Autonomous Driving Network 

Автоматическая диагностика среды эксплуатации насосной скважины

Эксперты начального уровня, могут стать экспертами 

Искуственный Интелект на транспорте

Автоматическое программирование интервала движения транспорта -> среднее время ожидания снизилось до 17.7%

Shenzein Traffic police

5G и Искуственыный Интелект неотделимы

Безбаръерные помещения 

Определение объёма выпускаемой продукции

Автономное вождение в шахтах

Распознавание номерных знаков

Контроль работы ветроэнергетических установок с помощью дронов

Анализ ….

Парадигма гибридных вычислений

ИИ-процессор на основании ARM

Kunpeng может работать на облаке

Везде TensorFlow, PyTorch

Автоматическая парковка, сортировка мусора 

Надо посмотреть:

Audi беспелотник МТС

MindSpore: All-scenario

Автоматически маркеруемые изображения эффективность + точность

Автономно + онлайн обучение

80000 изобр / день + 1000 изображений / день


Автоматизация ИИ

IBM Research

3000+ Исследователей в IBM

Научные Центры 

Автоматизация ИИ очень сложная штука

Автоматизация

Рабочий процесс синтеза модели с ограничениями. 

Watson Studio 

Watson ML

Watson OpenScale

Watson Knowledge Catalog


Вопрос телепортации

2030 году будет 1 млн транзисторов

20 лет назад был открыт Квантовый


CAT BOOST

New generation of Gradient Boosting

Типы данных:

  • неструктурированные данные
  • табличные данные 

Табличные данные: деревья решений

Чтобы получить ответы, нужно ответить на некоторые вопросы

Градиентный бустинг на деревьях решений -> предсказания с малым биасом

Python 

Можно получить хороший результат на малом количестве, а так же на большом количестве данных.

Yandex CatBoost

dmlcXGBoost

Microsoft LightGBM

Как можно использовать CatBoost в Алисе?

Намайненые ответы

Где используется?

Kaggle среди всего

Для обработки категориальных данных

Что будет работать лучше с фичами?

Текстовые фичи

Следующем мажорном релизе будет что-то с cmd 

Скорость обучения на CPU, GPU, Скорость Применения

Скорость применения

Внедрение в продакшн

Обычно на cpp всё пишем

Упращение жизни сцайнциста

TensorBoard

Powered by Journey Diary.

Сокращение рабочих мест – JOB LOSSES

Безусловный базовый доход, четырёхдневка

Искуственный интелект – возможность плавна двигаться вперёд

Люди развиваются, создаются дополнительные места

Секта для Самоубийц

Выбрасываются из окон в результае сокращения

Самоубийства всегда были в истории Человец

Нужно бежать изо всех сил только для того чтобы оставаться на месте

На макроуровне производительность труда замедляется

Имеет смысл когда производительность машины больше производительности человека

Роботы:

  1. Работа с Историческими Данными (Сбербанк, Газпром Нефть)

Роботизация – очень малый процент роботизации

Детешавая рабочая сила мешает этому

Гаджеты везде роботизирова, гаджеты роботизированы – остальное нет

В результате внедрения ИИ в России количество рабочих мест: увеличиться, считает зал.

МЕДИЦИНА

Каждый 3ий Американец умирает от врача))

Чтобы разобраться в старении нужно собрать вместе максимум и дать работать людям со сложными моделями

Искуственный интелект это всё таки попытка имитации Естественного Интелекта

Шанхайский Реабилитационный Госпиталь 

ТРАНСОРТ

УПРАВЛЕНИЕ СЛОЖНЫМИ СИСТЕМАМИ

В каких отрослых AI принесёт больше пользы:  финансы и медицина (зал)


Цифровой Ренесанс

Гений есть не у всех, но он есть у тебя

Перерождение человечества

Интелекткальные Агенты 

корни в 1956

Ролевые Игры учат детей


Microsoft AI

AI for All

Подход Microsoft

Azure AI

Демократизация ИТ

Когда данные понятны, тогда всё понятно, а когда данные непонятны тогда и нужен ML

С проблемами проблем нет, проблем хватает.

Нужно убирать мифы вокруг этой технологии.

Бейсик – этические правила и их регулирование

Русский язык – не первый язык на который мы локализуем.

Если не будете доверять системе, то не будете её использовать.

Агенты ИИ, Глубокое Обучение, Машинное Обучение – объединияется в АИ.

aibuilder

Агент это что-то что работает за Вас.

Что правильно и что нет, аналогично вопросы, что допустимо, а что нет.

Майнинг знаний.

Омниканальность – очень актуальная проблема

Бизнеса Школа ИИ 

aka.ms/aibs

Применять на практики и тогда будете учиться

Что нужно для начала с бизнесом ИИ? 

Начинать надо с малого маштаба, инвесторы приходят позже

С какой программой начать работать JAVA, Python, 


Как не разочароваться в искусственном интелекте?

Мы не можем улучшить то что нельзя измерить

Если нет метрики, то ИИ будет давольно бесполезен

Измерять нужно с высокой точностью

Для ИИ нужно ументь измерять с высокой точностью

Хорошие метрики рождаются не сразу

Уникально не имеет аналогов:

    1. Никто не додумался

  1. Никто не смог сделать
  2. Идея не слишком хорошая
  3. Стоимость внедрения перекрывает прибыть
  4. Это вообще невозможно сделать

Когда что-то открываем, то это нужно делать осторожно

Если это уже сделали, то идея уже хорошая.

Яндекс поиск.

1000 факторов, 1 вес формулы, 8 офлайн метрик, 10 онлайн метрик

1000 factors, 1 model size, 8 offline mertrics, 10 online metrics

Градиентный Бустинг

Каждый день готовиться новая формула, но не каждый день она лучше и лучше

Нельзя руками подбирать формулы размером 1 гб. 

Заразработали на рекламе 103 млрд рублей.

ML разработчики

  1. Инвесторы
  2. Менеджеры продукта
  3. Аналитики
  4. Разработчики-интеграторы

Команда внутри:

  • дорого
  • проапгрейдить разработчика до МЛ нанять несколько сильных разработчиков (один не приживётся)

Три ключевых вопроса:

  1. Какие ключевые показатели. на каком датасете они получены?
  2. Какие конкретно технологии используются?
  3. Какие есть конкурирующие решения?

Взять с собой

  1. ИИ не решает все задачи
  2. Для применения ИИ нужны метрики
  3. нужно исследовать чужой опыт
  4. Использование ИИ – это серьёзные инвестиции

Искуственный интелект это дорого? Он уже становиться дешевле! Отедльные компоненты постоянно дешевеют.

ИИ Правительства (А Я ДУМАЛ ТАК УЖЕ ОНО И ЕСТЬ!!!)


Виртуальный Ассистент ключевой элемент цифровизации бизенса

Виртуальный ассистент – новая ли штука?

Джарвис из Железного Человека

Концепция в традиционной культуре – Джин

Виртуальный Ассистент:

  • Помогает,
  • Понимает
  • Всегда и везде
  • Слышит

Что умеет реальный ассистент?

Поиск информации

Бронирование и оплата путешествий

Организация досуга, рутинных дел и тд

!!!

Голос в текстовый поиск

Поиск в google

Список ответов на печать или чтение

!!!

Разговорный интерфейс 

  1. Intent 
  2. Sentiment
  3. Context
  4. Content
  5. Functions

МТС Чатбот

Естественнный язык как универсальное средство коммуникации систем

Когда люди и системы разговаривают на одинаком языке?

Read me a haiku

Нейроинтерфейсы

Powered by Journey Diary.