Samara Portal Technology, Computers

Самарский портал "Технологии, компьютеры"

16 октября 2013 года в Москве в рамках конференции сообщества IT Galaxy «Прикоснись к будущему» с докладом выступил директор российского представительства Intel по маркетингу Андрей Матвеев. Он рассказал о значимости «Больших данных» для будущего и для Intel.

Андрей Матвеев, директор российского представительства Intel по маркетингу. Конференция сообщества IT Galaxy «Прикоснись к будущему». Москва. 16 октября 2013 г. Фото: Александр Семёнов.

Цель презентации – показать направление движения Intel в ближайшие несколько лет. О том, что такое «Большие данные», сегодня слышали уже многие. Эта тема становится для корпорации Intel одной из самых важных, именно на этом направлении открываются самые большие возможности. Дело в том, что эта тема содержит в себе все то, чем занимается корпорация – и серверную инфраструктуру, и клиентские ПК, и сервисы, и обеспечение безопасности.

В США недавно вышла книга «Большие данные с человеческим лицом». В ней рассказано о том, какую реальную пользу людям приносят современные ЦОДы и высокопроизводительные серверы. И какой объем данных сегодня связан с самыми простыми событиями. Один новорожденный сегодня – со всеми фотографиями, видео, записями в социальных сетях – генерит объем информации во много раз превосходящий объем библиотеки конгресса США. И мы пока только в самом начале движения к большим данным.

Мы не задумываемся о том, какое количество данных производим сегодня. Вот цитата председателя совета директоров компании Google Эрика Шмидта: «Пять экзабайт информации создано человечеством с момента зарождения цивилизации до 2003 года. Столько же информации сегодня создается каждые два дня, и эта скорость постоянно увеличивается».

Все это говорит о том, что мир сделал огромный шаг от индустриальной цивилизации к цивилизации информационной. В ближайшие годы информация будет править миром и надо научиться работать с этим. Те компании и страны, которые осознают это сегодня завтра будут править миром.

Чтобы осознать, где мы находимся сегодня, давайте отступим на пять-десять-двадцать лет назад. Сначала был компьютер, и мы с ним работали. Потом появилась сеть Интернет, и все мы стали подключенными людьми. Сегодня просто сложно представить себе, как можно жить без подключения к Интернету. В соответствии с этим корпорация Intel кардинально поменяла подход к своим продуктам. Во главу угла поставлен пользователь и его интересы, его потребности. Вокруг этого и создаются наши продукты и сервисы Intel.

Цикл нарастания контента, который требует все более мощных устройств, а они в свою очередь создают все более богатый контент, требующий еще более мощных устройств, непрерывен. Все пользователи чувствуют, как растут возможности их устройств, но в соответствии с этим растут и их потребности. И параллельно с этим нарастают и объемы данных. Не так давно мы мыслили категориями мегабайт, их всем хватало. Но все чаще в разговорах об объемах данных появляются новые названия «зетабайт» и «йотабайт». Кстати, йотабайт – это 10 в двадцать четвертой степени байтов.

С наступающей реальностью бороться бесполезно. Всем нужны новые возможности. Поэтому рост интереса к ЦОДам и «большим данным» понятен. Кроме того, что ЦОДы снижают издержки пользователей, они предоставляют им новые возможности и новые сервисы. Это первый аспект их популярности, второй связан с тем, что стремительно падают стоимости процессорной мощности и единиц хранения. За 10 лет стоимость хранения упала раз в десять, а производительности процессоров раза в 3-4. Один из аспектов этого удешевления состоит в том, что сервера скоро могут проникнуть в наши дома и стать потребительским продуктом. Третий аспект – это появление новых видов данных. Все больше появляется неструктурированных данных. Например, картинка с камеры наблюдения может накапливаться где-то и храниться. Чтобы сделать эти данные полезными, надо предпринять определенные усилия. Пока из накапливаемых данных трудно извлечь пользу. Как это сделать?

Итак, данные где-то копятся, их надо хранить, обрабатывать и уметь извлекать из них пользу. Это первая проблема. Вторая – обеспечение безопасности этих данных.

Объемы накопления данных расширяются с каждым днем, постоянно появляются все новые и новые каналы накопления этих данных. Кроме хорошо известных всем печатных изданий, Интернета, радио и телевидения, появляется огромное количество сенсоров, которые могут предоставить океан необходимой информации. Все эти данные собираются и где-то накапливаются, а после этого их можно анализировать и что-то моделировать с их помощью. А вот уже анализ и моделирование требует серьезных вычислительных мощностей. Для этого необходимы новые мощные сервера и специальное ПО. Только с их помощью можно выявить какие-то тенденции, анализируя «большие данные». Пока это мало кто делает, а кто начнет делать, опередит конкурентов.

Пример. В Intel есть очень много данных, связанных с потребителями. Это результаты опросов, а теперь появилось огромное количество данных из социальных медиа. Все это как-то обсуждается, но конкретной информации о пользователях нет. Она находится на серверах социальных сетей. Сейчас у Intel есть план проанализировать все данные о пользователях. Можно попытаться проанализировать их предпочтения и пожелания и сделать какие-то выводы. Вот реальная работа с «большими данными».

Рассмотрим, что же можно сделать с помощью «больших данных». Анализом транспортного потока сегодня занимаются многие. В одной из азиатских столиц обратили внимание на то, что при начале дождя, количество вызовов такси в этом регионе возрастает. Компания, занимающаяся услугами такси, стала тщательно анализировать перспективы осадков в районах города и направлять туда свои такси заранее.

Очень важен тщательный анализ предпочтений и расположения потребителей при предоставлении им рекламы. Чтобы реклама была эффективной, надо четко знать, что, когда и кому рекламировать, а для этого надо проанализировать весь массив информации о потребителях.

Медицина – это уже сейчас «большие данные». Борьба с болезнями сегодня часто ведется не с помощью пробирок и шприцев, а с помощью анализа всей возможной информации на серверах.

И не только в медицине, но и в автомобилестроении. Самая последняя модель автомобиля RangeRover была создана без единого натурного теста, с помощью только компьютерного анализа. Ни одна машина не пострадала в результате их проведения. Весь дизайн, все тесты надежности и безопасности были проведены виртуально. Современный автомобиль – это очень сложное устройство, можно представить, сколько всего пришлось просчитать и пересчитать. И этот пример становится все более популярным у автомобилестроителей всего мира.

Итак, мы видим, что сегодня «большие данные» уже накапливаются и начинают использоваться. Например, в процессе полета самолета из Европы в США и обратно накапливается полтерабайта информации – это связь с землей, показатели черных ящиков, показания самых разных сенсоров и датчиков. Они передаются, но никогда не обрабатываются и не анализируются. Может, стоит подумать о том, как их анализировать? Или сократить объем? Еще одно направление работы с большими данными – думать над ними.

Еще один пример работы с большими данными. Пробки есть везде, в том числе и Риме. Римский муниципалитет задумался – почему они возникают? Оказалось, что в центре города тысячи машин ездят кругами в поисках места для парковки. Если поставить датчики в местах парковки и информировать всех желающих об этом, то пробки в центре можно существенно уменьшить.

Еще пример из Лондона. На вопрос о самой большой проблеме администрации города, ее представители достаточно неожиданно ответили – вода. Из озер, которыми питается город, до пользователей доходит только 60% воды. Почему – никто не знает. Думают о том, как встроить в систему водоснабжения города большое количество сенсоров и анализировать их показания.

Что делает Intel? Intel делает самые разные сенсоры. Недавно был объявлен новый процессор Quark с экстремально низким энергопотреблением (меньше одного ватта) как раз для работы в сенсорах любого типа. Он может также прекрасно работать в сенсорах, которые в недалеком будущем мы все будем носить на себе. Второе направление работы – это сервера. Третье – это программное обеспечение. Intel приобрел компанию, которая предлагает решения для обработки «больших данных».

Итак – большие данные предоставляют большие возможности для пользователей, но и для Intel, чтобы удовлетворить потребности пользователей.

----

Цифровизация 2023: что это такое

Цифровизация 2023: что это такое. Статья Владислава Боярова. 09.03.2023 г.

Галопом по вычислительным Европам. Часть 6. Спецпроцессоры.

Галопом по вычислительным Европам. Часть 6. Спецпроцессоры. Часть 5. Память. Статья Ильи Вайцмана. 15.03.2023 г.

«Домашний компьютер». Конкурс в Самаре.

«Домашний компьютер». Конкурс в Самаре.

Blood, Sweat & Tears, или Кровь, пот и слёзы – часть третья, объединительная

ИТ-Перестройка-2023 от OCS

ИТ-Перестройка-2023 от OCS. Статья Владислава Боярова. 10.03.2023 г.