Новости
Microsoft Academic: научный поисковик, который предлагает меньше искать (и это разумно!)
- Информация о материале
- 06 ноября 2020
Многие должно быть знакомы с фразой «Стоя на плечах гигантов», которая предваряет поиск в Google Scholar. Однако, если вдруг вы устали взбираться на чьи-то плечи и хотите поскорее заняться исследованиями, предлагаем познакомится с платформой Microsoft Academic, с помощью которой вы сможете быстро и уверенно подбирать себе новые тексты, ведь их принцип “research more, search less”, как раз об этом.
Про Google Scholar — поисковик по научным публикациям от компании Google — уже наверняка знает большинство участников российского академического сообщества, начиная от бакалавров и заканчивая ведущими научными сотрудниками (мы тоже о нем знаем и даже сделали отдельный материал по работе с Google Scholar для вас).
А вот про платформу Microsoft Academic, которая не менее достойна, но пока не так популярна, знают и пишут немногие, поэтому чтобы выгодно подчеркнуть свои профессиональные навыки рекомендуем не только обратить внимание на ресурс компании Microsoft, который поможет разобраться, что происходит в области ваших исследований, но и почаще о нем рассказывать.
Microsoft Academic была создана компанией Microsoft еще в 2006 году и называлась Microsoft Academic Search. В настоящий момент Microsoft Academic индексирует почти 250 млн публикаций разного типа: в их числе журнальные статьи, книги и главы книг, патенты, материалы конференций.
Свой нынешний вид и название платформа приобрела в 2016 году. Слово «поиск» пропало из названия не случайно: с этого времени сервис стал концентрироваться не на простых видах поиска, а на сборе, анализе и разных способах выдачи/визуализации данных. Подробнее о том, на каких технологиях работает поиск вы можете прочитать в разделе «Особенности поиска в Microsoft Academic».
Рис. 1. Страница с аналитикой по журналами про бизнес.
Рис. 2. Профиль автора с дополнительной информацией для оценки исследовательского поля.
Важно! В Microsoft Academic вы не найдете информации на русском языке, поскольку на данный момент для проекта значимы только материалы на английском. Однако для большинства это не должно стать проблемой, поскольку читать на английском языке — рутина любого аналитика и исследователя.
Начать работу с платформой, если в планируете ей пользоваться на постоянной основе, нужно с регистрации. Так у вас появится свой личный кабинет, в котором будет храниться информация о ваших публикациях и полученных цитированиях, если вы исследователь (при регистрации вы введете свой ORCID ID, который и позволит системе подгрузить ваши публикации в профиль).
Кроме того, в личном кабинете будут хранится ваши списки для чтения. Это особенно актуально для тех, кто будет пользоваться платформой для поиска литературы. Возможности добавлять свои статьи в профиль, как это делается в Google Scholar, здесь нет. Поэтому если вы хотите иметь полный список, то нужно вносить их через ORCID. К счастью, никто метриками с этого сайта в вузах и министерствах не интересуется, поэтому можно этим и не заниматся.
Самое главное, что личный кабинет позволяет следить за публикациями по интересующим вас тематикам (тематики выбираются при регистрации). В базе Microsoft Academic более 740 тыс. тематик, поэтому проблем с поиском не будет. В вашем личном кабинете во вкладку “Publications from Follows” будут прогружаться публикации по выбранным темам.
Чтобы найти что-то в Microsoft Academic можно воспользоваться поисковой строкой вверху страницы. В ней можно название журнала, тему, имя автора или сформулировать более конкретный запрос. Результаты выдаются в виде перечня публикаций с метаданными: библиографическое описание, аннотация, цитирования. Полученные результаты можно отфильтровать по годам, тематической области, типу публикации, авторам, журналам, организациям, конференциям. Сортировать результаты можно по степени релевантности, по дате публикации или по количеству цитирований.
Рис. 3. Выбор способа сортировки на странице с результатами поиска про грамотность работы с данными.
Если публикация есть в открытом доступе, система показывает ссылку на ее местонахождение. Для этого нужно в общем списке нажать на конкретную публикацию. Помимо ссылки на скачивание в карточке каждой публикации есть вкладки с библиографическим списком, списком цитирующих публикаций и списком похожих публикаций. На эту информацию обязательно нужно обратить внимание тем, кто подбирает себе литературу, пытается разобраться в предметной области или ищет новых авторов по своей теме.
Рис. 4. Страница статьи с рекомендациями других материалов по теме статьи.
Большинство поисковых систем, с которыми вы имеете дело, работают с ключевыми словами. Вы пишете запрос и получаете документы, где встречаются интересные вам слова или целые наборы слов, если вы умеете писать сложные поисковые запросы. Именно так работают поисковики в индексах научного цитирования: Web of Science, Scopus или РИНЦ. По похожей схеме работает и Google Scholar. Однако обычные поисковые сервисы — простой поиск Яндекса, Google или Bing (Microsoft) снабжают ваш запрос дополнительной информацией и по сути подстраиваются под ваши интересы/под интересы рекламодателей. Если вы — студент, то вам, например, будут продавать беспроводные наушники, модные кроссовки или курсы английского или Python (кажется, это что-то типа набора леди и джентльменов 20-х годов XXI века).
Чем плох поиск по ключевым словам? В случае с индексами научного цитирования — ничем. Только есть проблема, что вы получаете ровно то, что ищете. И это проблема, ведь часто мы не совсем понимаем, что хотим найти. А вот в случае с обычными поисковиками, проблема посложнее, поскольку вы получаете то, что скорее всего нравится таким же, как вы, и продается им разными заинтересованными компаниями. Конечно, любые ограничения можно обойти. И одним из способов обхода навязываемого вам знания или невозможности найти то, что нужно, может стать семантический поиск.
Как раз на основе семантического поиска и работает Microsoft Academic. Что же это означает (по крайней мере в теории). Все довольно просто: система ищет не по конкретному слову или набору слов, а по тому, к чему эти слова могут иметь отношения. Для обычного языка такую задачу решить не очень просто, а вот для науки — более или менее реально. Как известно, ученые часто используют термины, значение которых более или менее стабильно и от контекста почти не зависит. Поэтому Microsoft Academic будет предлагать вам документы не потому, что в них есть отдельные слова, а потому что после анализа разных документов, система пришла к выводу, что в отдельных документах есть что-то по смыслу для вас полезное. На SkyNet не похоже, поэтому пока можно пользоваться без опасений. В чем плюсы для обычного пользователя? Во-первых, можно увидеть что-то новое по своей теме, что в других поисковиках скрывалось за частоколом слов. Во-вторых, можно составить набор полезных категорий, для того, чтобы потом проверять их по «обычным» поисковым системам.
Источники, которые вам показались важными, можно (и нужно) сохранять в списки для чтения (нажать на значок с книжками после описания публикации). Списков для чтения можно составлять сколько угодно, в зависимости от разнообразия ваших тематик. Посмотреть содержание своих списков для чтения можно, нажав на тот же значок с книгами, но уже в правом верхнем углу страницы (там, где ваше имя и аватар).
Рис. 5. Список сохраненных документов в личном аккаунте.
Обратите внимание, что составление списков для чтения доступно только тем, кто зарегистрировался. Просто искать публикации вы можете и так. Но в долгосрочной перспективе работа без регистрации не так удобна.
Как уже было сказано, Microsoft Academic — это больше научный проект по развитию технологий семантического поиска и обработки разного типа данных. То, что мы можем пользоваться поиском — хорошо. Но если вы хоть в каком-то виде умеете работать с данными, то сможете извлечь еще больше пользы. Если вы занимаетесь машинным обучением или просто заинтересованы в том, чтобы понять, как развивается ваше исследовательское поле и думаете, что неплохо было написать статью в модном сейчас жанре анализа больших массивов, то различные API вам в помощь. Подробнее об них можно прочитать на специальной странице про Microsoft Academic Graph.
Если вас заинтересовало то, как работает Microsoft Academic, то вы можете почитать одну из последних записей в их блоге про то, что появилось в этом сервисе в середине 2020 года. Там есть рекомендации по сложным запросам и объяснение разницы между поиском по ключевым словам и семантическим поиском в подробностях.
В 2020 году у каждого студента и исследователя под рукой большое количество самых интересных инструментов: баз данных, книжных и журнальных платформ, платных и бесплатных поисковиков. К каким-то мы привыкли больше, к каким-то меньше. Microsoft Academic — не самый типичный поисковик с интересными, по сути передовыми технологиями обработки информации. При этом полезен он будет не только специалистам по обработке данных и машинному обучению, а всем, кто хочет следить за новостями в своей науке. Нам кажется, что Microsoft Academic может помочь многим лучше понимать сложные отношения той темы, которой вы непосредственно занимаетесь, с многими другими темами, которые еще пока не появлялись на горизонте вашего научного интереса. Поэтому считаем, что для сформировавшихся исследователей, аспирантов и самых бодрых магистров, Microsoft Academic — это правильный выбор.
Анастасия Маслова, Варвара Сергеева, Константин Кокарев
Отдел поддержки исследований
Научная библиотека РАНХиГС, г. Москва
Про Google Scholar — поисковик по научным публикациям от компании Google — уже наверняка знает большинство участников российского академического сообщества, начиная от бакалавров и заканчивая ведущими научными сотрудниками (мы тоже о нем знаем и даже сделали отдельный материал по работе с Google Scholar для вас).
А вот про платформу Microsoft Academic, которая не менее достойна, но пока не так популярна, знают и пишут немногие, поэтому чтобы выгодно подчеркнуть свои профессиональные навыки рекомендуем не только обратить внимание на ресурс компании Microsoft, который поможет разобраться, что происходит в области ваших исследований, но и почаще о нем рассказывать.
Краткая справка о Microsoft Academic
Microsoft Academic была создана компанией Microsoft еще в 2006 году и называлась Microsoft Academic Search. В настоящий момент Microsoft Academic индексирует почти 250 млн публикаций разного типа: в их числе журнальные статьи, книги и главы книг, патенты, материалы конференций.
Свой нынешний вид и название платформа приобрела в 2016 году. Слово «поиск» пропало из названия не случайно: с этого времени сервис стал концентрироваться не на простых видах поиска, а на сборе, анализе и разных способах выдачи/визуализации данных. Подробнее о том, на каких технологиях работает поиск вы можете прочитать в разделе «Особенности поиска в Microsoft Academic».
Для чего будет полезен Microsoft Academic?
- для поиска и рекомендации литературы: как и Google Scholar, Microsoft Academic осуществляет поиск по своей базе публикаций: их почти 245 млн (напомним, что в WoS и Scopus храниться около 100 млн, то есть меньше), 259 млн авторов, более 4500 конференций, 25 тыс. организаций. Публикации собираются в базу не только из журналов (которых почти 49 тыс.), но и из материалов конференций, далеко не все из которых попадают в индексы научного цитирования;
Рис. 1. Страница с аналитикой по журналами про бизнес.
- для составления подборок литературы: найденные публикации можно сохранять и обращаться к ним потом;
- для анализа сводной информации по авторам, журналам, публикациям. Здесь вы не найдете библиометрии в чистом виде, но это даже хорошо: будет больше поводов поразмыслить об аналитике, а не просто на нее ссылаться;
Рис. 2. Профиль автора с дополнительной информацией для оценки исследовательского поля.
- для возможности работать с Microsoft Academic Graph: тем, кто умеет работать с данными по API и анализировать большие массивы информации, Microsoft Academic предлагает различные способы работы с данными, которые можно посмотреть в поисковике;
Важно! В Microsoft Academic вы не найдете информации на русском языке, поскольку на данный момент для проекта значимы только материалы на английском. Однако для большинства это не должно стать проблемой, поскольку читать на английском языке — рутина любого аналитика и исследователя.
С чего начать?
Начать работу с платформой, если в планируете ей пользоваться на постоянной основе, нужно с регистрации. Так у вас появится свой личный кабинет, в котором будет храниться информация о ваших публикациях и полученных цитированиях, если вы исследователь (при регистрации вы введете свой ORCID ID, который и позволит системе подгрузить ваши публикации в профиль).
Кроме того, в личном кабинете будут хранится ваши списки для чтения. Это особенно актуально для тех, кто будет пользоваться платформой для поиска литературы. Возможности добавлять свои статьи в профиль, как это делается в Google Scholar, здесь нет. Поэтому если вы хотите иметь полный список, то нужно вносить их через ORCID. К счастью, никто метриками с этого сайта в вузах и министерствах не интересуется, поэтому можно этим и не заниматся.
Самое главное, что личный кабинет позволяет следить за публикациями по интересующим вас тематикам (тематики выбираются при регистрации). В базе Microsoft Academic более 740 тыс. тематик, поэтому проблем с поиском не будет. В вашем личном кабинете во вкладку “Publications from Follows” будут прогружаться публикации по выбранным темам.
Как искать?
Чтобы найти что-то в Microsoft Academic можно воспользоваться поисковой строкой вверху страницы. В ней можно название журнала, тему, имя автора или сформулировать более конкретный запрос. Результаты выдаются в виде перечня публикаций с метаданными: библиографическое описание, аннотация, цитирования. Полученные результаты можно отфильтровать по годам, тематической области, типу публикации, авторам, журналам, организациям, конференциям. Сортировать результаты можно по степени релевантности, по дате публикации или по количеству цитирований.
Рис. 3. Выбор способа сортировки на странице с результатами поиска про грамотность работы с данными.
Если публикация есть в открытом доступе, система показывает ссылку на ее местонахождение. Для этого нужно в общем списке нажать на конкретную публикацию. Помимо ссылки на скачивание в карточке каждой публикации есть вкладки с библиографическим списком, списком цитирующих публикаций и списком похожих публикаций. На эту информацию обязательно нужно обратить внимание тем, кто подбирает себе литературу, пытается разобраться в предметной области или ищет новых авторов по своей теме.
Рис. 4. Страница статьи с рекомендациями других материалов по теме статьи.
Особенности поиска в Microsoft Academic
Большинство поисковых систем, с которыми вы имеете дело, работают с ключевыми словами. Вы пишете запрос и получаете документы, где встречаются интересные вам слова или целые наборы слов, если вы умеете писать сложные поисковые запросы. Именно так работают поисковики в индексах научного цитирования: Web of Science, Scopus или РИНЦ. По похожей схеме работает и Google Scholar. Однако обычные поисковые сервисы — простой поиск Яндекса, Google или Bing (Microsoft) снабжают ваш запрос дополнительной информацией и по сути подстраиваются под ваши интересы/под интересы рекламодателей. Если вы — студент, то вам, например, будут продавать беспроводные наушники, модные кроссовки или курсы английского или Python (кажется, это что-то типа набора леди и джентльменов 20-х годов XXI века).
Чем плох поиск по ключевым словам? В случае с индексами научного цитирования — ничем. Только есть проблема, что вы получаете ровно то, что ищете. И это проблема, ведь часто мы не совсем понимаем, что хотим найти. А вот в случае с обычными поисковиками, проблема посложнее, поскольку вы получаете то, что скорее всего нравится таким же, как вы, и продается им разными заинтересованными компаниями. Конечно, любые ограничения можно обойти. И одним из способов обхода навязываемого вам знания или невозможности найти то, что нужно, может стать семантический поиск.
Как раз на основе семантического поиска и работает Microsoft Academic. Что же это означает (по крайней мере в теории). Все довольно просто: система ищет не по конкретному слову или набору слов, а по тому, к чему эти слова могут иметь отношения. Для обычного языка такую задачу решить не очень просто, а вот для науки — более или менее реально. Как известно, ученые часто используют термины, значение которых более или менее стабильно и от контекста почти не зависит. Поэтому Microsoft Academic будет предлагать вам документы не потому, что в них есть отдельные слова, а потому что после анализа разных документов, система пришла к выводу, что в отдельных документах есть что-то по смыслу для вас полезное. На SkyNet не похоже, поэтому пока можно пользоваться без опасений. В чем плюсы для обычного пользователя? Во-первых, можно увидеть что-то новое по своей теме, что в других поисковиках скрывалось за частоколом слов. Во-вторых, можно составить набор полезных категорий, для того, чтобы потом проверять их по «обычным» поисковым системам.
Как сохранять в списки для чтения?
Источники, которые вам показались важными, можно (и нужно) сохранять в списки для чтения (нажать на значок с книжками после описания публикации). Списков для чтения можно составлять сколько угодно, в зависимости от разнообразия ваших тематик. Посмотреть содержание своих списков для чтения можно, нажав на тот же значок с книгами, но уже в правом верхнем углу страницы (там, где ваше имя и аватар).
Рис. 5. Список сохраненных документов в личном аккаунте.
Обратите внимание, что составление списков для чтения доступно только тем, кто зарегистрировался. Просто искать публикации вы можете и так. Но в долгосрочной перспективе работа без регистрации не так удобна.
Исследования данных в Microsoft Academic
Как уже было сказано, Microsoft Academic — это больше научный проект по развитию технологий семантического поиска и обработки разного типа данных. То, что мы можем пользоваться поиском — хорошо. Но если вы хоть в каком-то виде умеете работать с данными, то сможете извлечь еще больше пользы. Если вы занимаетесь машинным обучением или просто заинтересованы в том, чтобы понять, как развивается ваше исследовательское поле и думаете, что неплохо было написать статью в модном сейчас жанре анализа больших массивов, то различные API вам в помощь. Подробнее об них можно прочитать на специальной странице про Microsoft Academic Graph.
Если вас заинтересовало то, как работает Microsoft Academic, то вы можете почитать одну из последних записей в их блоге про то, что появилось в этом сервисе в середине 2020 года. Там есть рекомендации по сложным запросам и объяснение разницы между поиском по ключевым словам и семантическим поиском в подробностях.
В 2020 году у каждого студента и исследователя под рукой большое количество самых интересных инструментов: баз данных, книжных и журнальных платформ, платных и бесплатных поисковиков. К каким-то мы привыкли больше, к каким-то меньше. Microsoft Academic — не самый типичный поисковик с интересными, по сути передовыми технологиями обработки информации. При этом полезен он будет не только специалистам по обработке данных и машинному обучению, а всем, кто хочет следить за новостями в своей науке. Нам кажется, что Microsoft Academic может помочь многим лучше понимать сложные отношения той темы, которой вы непосредственно занимаетесь, с многими другими темами, которые еще пока не появлялись на горизонте вашего научного интереса. Поэтому считаем, что для сформировавшихся исследователей, аспирантов и самых бодрых магистров, Microsoft Academic — это правильный выбор.
Анастасия Маслова, Варвара Сергеева, Константин Кокарев
Отдел поддержки исследований
Научная библиотека РАНХиГС, г. Москва