Leonid Dmitriev ([info]leozub) wrote,
@ 2006-12-17 23:54:00
Previous Entry  Add to memories!  Tell a Friend  Next Entry
Google в МГУ
Утром 13 декабря около входа на факультет раздавали листовки с призывом посетить выступление вице-президента компании Google Алана Юстаса (Alan Eustace). Я знал о нем и без этого, причем такая реклама меня удивила. Пришел примерно за десять минут до начала. У входа в 02 аудиторию ГЗ была толпа, и внутрь по причине отсутствия мест не пускали. Пробрался к двери и помахал ксивой перед охранником: "А если я преподаватель, мне это поможет попасть внутрь?" Помогло.

После приветствия Алан Юстас произнес стандартные слова о растущем влиянии Интернета на нашу жизнь и технологической революции. Удешевление компьютерной техники показывалось в сравнении с ценами на топливо. Очень не понравилось то, что объем Веба приравнивался к объему индекса поисковой системы. Про Surface Web и Hidden (Deep) Web не было сказано ни слова.

Были перечислены с краткой характеристикой основные сервисы Google (с особым упором на книжные проекты). Отмечено, что с 13 декабря работают русскоязычные новости и для регистрации в Гмыле из России больше не требуется приглашения.

Было сказано и о технологиях Google. Ключевые слова: вычислительная нагрузка, масштабируемость, Linux, системная надежность. Отдельные дешевые компьютеры часто выходят из строя, но вся система работает устойчиво. Приведен пример перераспределения нагрузки при пожаре.

Больше полвины пользователей Интернета живут за пределами США, и английский язык для них не является родным. По этой причине подразделения Google созданы во многих странах. Лучшие ученые в области CS в России, поэтому открыто 2 центра разработки в Москве и Санкт-Петербурге. Несколько слов было сказано об условиях работы: маленькие группы разработчиков, 20% рабочего времени можно официально тратить на личные проекты...

Некоторые любопытные данные о запросах к Google. Во время блэкаута в Нью-Йорке и окрестностях оттуда продолжало поступать значительное количество запросов. Во время финала чемпионата мира по футболу наблюдалось резкое снижение количества запросов.

Коррекция орфографических ошибок помогает в поиске. Существует более 800 способов написать Britney Spears с ошибкой.

Google развивает статистические методы машинного перевода и участвует в NIST Machine Translation Evaluation. Один и тот же статистический метод при значительном росте обучающей выборки показывает значительный рост результатов.

Алан Юстас закончил выступление весьма смелым и оптимистичным прогнозом о мультиязычном доступе к информации через 5-10 лет.

Кратко пройдусь по ответам на вопросы аудитории.

  • Первую пару вопросов задала "девушка с рогами". Зачем нужна статистика ошибок в написании Britney Spears - для оптимизация проверки орфографии. Зачем была создана поисковая система Gogle (Google с одним o) - Алан Юстас не слышал о такой. /*Ошибиться можно не только в написании Britney Spears. :) Gogle.com ведет на Google.com, а Gogle.ru принадлежит киберсквоттерам.*/

  • Как надежно хранить информацию? Делать резервные копии.

  • Яндекс и Рамблер достойные конкуренты, но мы их превзойдем если будем и дальше нанимать таких как вы.

  • Обновление карт происходит примерно раз в год. Москву пора обновлять.

  • Довольно забавно объединение цензуры, авторских прав и терроризма в одном вопросе.

  • Каковы входные барьеры для работы в Google? Много стандартных слов о способностях и желании (отдельно отмечена потребность в ученых в области CS).

  • С ростом киберпреступности и спама можно бороться.

  • По словам Алана Юстаса Google не разрабатывает своей операционной системы.

  • У Google есть российские корни, ибо Брин.

  • На длинный вопрос о стоимости разработки информационных систем был дан ответ, что важна инфраструктура и доступ к большим объемам данных. Команда в компании Google добьется большего успеха, чем команда такого же размера и с таким же бюджетом за ее пределами.

  • Над поисковой и рекламной системами трудятся 70% разработчиков.

  • Тема манипулирования в выдаче по популярным запросам не была обойдена вниманием.

  • Выдача полностью автоматическая, люди не участвуют в ее формировании. 40% запросов уникальны, то есть ранее не наблюдались.

  • Исследования ведутся, новые технологии развиваются. Видео очень перспективно, куплен YouTube.

  • Хранение больших объемов информации обеспечивается самыми простыми и дешевыми из обеспечивающих достаточное качество носителями.

  • Алан Юстас получил степень в области CS (где именно он не сказал, но на официальном сайте написано, что в University of Central Florida). В компании Google примерно поровну сотрудников, обладающих степенями бакалавра, магистра и Ph.D.


В конце было обещано опубликовать ответы на оставшиеся вопросы в официальном русскоязычномом блоге компании Google. (На момент отправки поста их нет.)

Несколько общих слов о мероприятии. Привлекать такую одиозную организацию как Студсоюз не стоило, так как информация о раздаче флэшек расползлась заранее, и многие целенаправленно пришли за халявой, а Google был им до лампочки. Огорчило поведение некоторых студентов (ногами по столам бегом к выходу).

О том, что не остался на "кулуарную" часть не жалею. Судя по описаниям ничего особо интересного там тоже не было. (Похоже, причина еще и в том, что у меня есть другой канал связи с Google.)

P.S. Переводчица реально отжигала: "gallon of gas" == "два литра газа".

P.P.S. Другие отчеты (1, 2, 3, 4). В [info]msu тоже пошло обсуждение - первый комментарий по делу, а дальше местами отжиг.

P.P.P.S. Возможно, написано излишне критично. Но выступление было ориентировано на пользователей, а я ожидал другого. О пользовательской направленности мероприятия свидетельствует и содержимое раздававшегося CD - прикладные программы.

P.P.P.P.S. Перечитал перед отправкой. Забыл написать, что миссии Google был посвящен отдельный слайд.



(4 comments) - (Post a new comment)


[info]itman
2006-12-17 09:51 pm UTC (link)
Ничуть не критично.
"800 способов написать Britney Spears с ошибкой."
Способов гораздо больше, но сколько-нибудь вменяемых мало. 800 способов это примерно 30 способов на слово. Многовато-то как-то для слова из 5-7 букв. В действительности, "популярных" ошибок должно штук 5-10.

(Reply to this) (Thread)


[info]itman
2006-12-17 09:54 pm UTC (link)
Уж не врал бы товарищ Алан, что Гугл так любит российских ученых. Если бы любил, открыл бы центры разработки на 2-3 года раньше. По модулю того, что в России открыли центр после Швейцарии, Ирландии, Южной Америке и Израиля, смешно расписываться в своей любви к российским ученым.

(Reply to this) (Parent)(Thread)


[info]baldis
2006-12-18 06:59 am UTC (link)
Раз уж открылись - надо пиариться... =))

(Reply to this) (Parent)


[info]leozub
2006-12-18 05:48 pm UTC (link)
Пользователи Google ошибались >800 способами.

(Reply to this) (Parent)


(4 comments) - (Post a new comment)

Create an Account
Forgot your login or password?
Login w/ OpenID
English • Español • Deutsch • Русский…