Scientific journal
International Journal of Applied and fundamental research
ISSN 1996-3955
ИФ РИНЦ = 0,593

PRACTICAL APPLICATION OF THE SEARCH AND SCIENTOMETRIC PLATFORM GOOGLE SCHOLAR (GOOGLE ACADEMY)

Bizenkov E.A. 1
1 ANO «Academy of Natural History»
2337 KB
The article analyzes the work of searching and scientometric platform Google Scholar (Google Academy). The history of Google Academy database creation is described. Peculiarities, positive and negative elements of operation system are considered; the database main features are shown. The system is compared with other science-based platforms. The characteristics of the main modern science-based indicators of publication activity are described; the methods and peculiarities of their application in Google Scholar are indicated. The importance of Google Scholar’s science-based indicators is assessed when compiling reports on the performance of scientific organizations. Top list of scientific journals of Google Scholar Russian segment is considered. As a criterion for ranking, the h-index of journals was used in the Google Academy database. The information on the journals occupying the leading positions in the rating of the Russian-language and foreign segments of scientific publication is given; the analysis of the success of Russian-language journals is made.
Google Scholar
scientometric base
scientometric indicators
h-index
citing
search engine

Согласно действующему российскому законодательству развитие науки является одним из основных приоритетов государственной политики Российской Федерации, первенство в исследованиях и разработках, высокий темп освоения новых знаний и создания инновационной продукции являются ключевыми факторами, определяющими конкурентоспособность национальных экономик и эффективность национальных стратегий безопасности [1].

В связи со значимостью развития науки государство уделяет особое внимание оценке результативности деятельности научных организаций, исследователей, ученых, работников научной сферы. Одним из основных способов оценки успешности работы во всех сферах деятельности является составление и обобщение статистической информации. Координатором государственной оценочной деятельности в научной сфере является Федеральное агентство научных организаций РФ (ФАНО России).

ФАНО России разработаны Методические рекомендации по предоставлению научными организациями наукометрических данных в Федеральной системе мониторинга результативности деятельности научных организаций, выполняющих научно-исследовательские, опытно-конструкторские и технологические работы. Анализ методических рекомендаций позволяет сделать вывод о том, что значимой частью научной отчетности является информация о публикации результатов деятельности ученых в периодических научных журналах [2].

Объективную оценку результативности публикационной активности ученых позволяют дать функционирующие в настоящее время наукометрические базы данных, такие как Российский индекс научного цитирования РИНЦ, Google Scholar, Scopus, Web of Science и другие. Наукометрические показатели указанных баз являются значимым критерием оценки результативности деятельности научных организаций и отдельных ученых. Высокий уровень результативности, в свою очередь, влияет на важные практические аспекты деятельности организации, в том числе ее финансирование.

Учитывая сложившуюся ситуацию, представляется важным наличие знаний о принципах и особенностях работы наукометрических баз данных у каждого научного работника. Является актуальным изучение и проведение анализа особенностей работы наукометрических баз с целью применения полученных знаний при использовании указанных баз данных на практике.

В настоящей статье рассматриваются особенности функционирования распространенной в России и во всем мире поисковой и наукометрической системы Google Scholar. Платформа Google Scholar рассмотрена не только как наукометрическая база данных, но и как инструмент поиска, хранения, идентификации и упорядочивания научной информации.

При написании работы использованы методы анализа и обобщения информации о функционирующих в настоящее время российских и международных наукометрических базах данных, способах их практического использования, возможностях и преимуществах отдельных баз.

В настоящее время платформа Google Scholar, являясь составной частью поисковой системы Google, представляет из себя набор инструментов, позволяющих искать и цитировать научную информацию, осуществлять расчет наукометрических показателей изданий и авторов, определять наиболее авторитетные научные издания и многое другое. Однако первоначально платформа была создана на базе сайта Google исключительно для поиска информации.

Идея создания сервиса, позволяющего быстро искать информацию, содержащуюся в научных изданиях, принадлежит сотрудникам компании Google Алексу Верстаку и Анурагу Ачария, которые в начале XXI века работали над совершенствованием основного веб-поиска Google [3]. Считая работу деятелей науки наиболее глобальной, Верстак и Ачария поставили себе цель создать сервис, способный как минимум на 10% улучшить эффективность работы исследователей, решающих мировые проблемы [4].

Разрабатываемый сервис должен был обеспечить наиболее простой и точный доступ к научным знаниям. Проект получил название Google Scholar (Академия Google). Поставленная цель нашла свое отражение в слогане Академии Google – «Стоя на плечах гигантов». Данное выражение принадлежит Исааку Ньютону и Бернару Шартрскому: «Мы как карлики на плечах гигантов, и потому можем видеть больше и дальше, чем они». Выражение отдает дань деятелям всех эпох, внесшим значительный вклад в развитие науки и заложившим основу для дальнейших интеллектуальных достижений [5]. Идеи фокуса поисковой системы исключительно на научных данных нашли свое отражение в запуске системы Google Scholar.

В 2004 году запущена бета-версия проекта, являвшаяся по своей сути версией поисковой машины Google, осуществляющей поиск информации исключительно по научным изданиям. С течением времени сервис Академия Google получал более широкий набор функций и возможностей. В 2006 году добавлена возможность автоматического формирования и импорта библиографических ссылок на научные работы, индексируемые системой. Кроме того, реализована возможность выгрузки выходных данных научных работ в программы автоматического формирования библиографических списков – RefWorks, RefMan, EndNote и BibTeX.

В 2007 году Ачария объявил, что Google Scholar запустил программу хостинга и оцифровки научных журналов. Реализация программы осуществлялась по соглашению с издателями журналов и проводилась независимо от функционировавшего ранее сервиса Google Books. Google Books предоставлял доступ лишь к самим текстам научных работ, в то время как Google Scholar позволил выделить метаданные изданий, что существенно облегчило идентификацию, поиск научных работ и их цитирование [6].

Существенно расширила возможности сервиса Google Scholar произведенная в 2012 году доработка. Появилась возможность создать профиль ученого Google Scholar Citation. Данный инструмент позволяет создать общедоступный профиль ученого, содержащий информацию обо всех научных трудах ученого и автоматически рассчитывающий личные наукометрические показатели. Также реализована перекрестная система индексирования цитирований научных журналов, позволяющая определять наукометрические показатели каждого издания, входящего в базу Академии Google. Таким образом, функциональная система Google Scholar модернизировалась в полноценную информационную наукометрическую базу данных [7].

В ноябре 2013 года разработчиками Google представлена очередная глобальная доработка Академии Google. Каждый пользователь системы получил возможность создать свою собственную библиотеку научных изданий, сохраняя в ней как объекты, так и результаты поиска по запросам. Кроме того, реализована функция построения рейтинга научных изданий по научным отраслям и по языковому сегменту. Данная функция позволяет авторам определить действительно авторитетные издания для опубликования научных работ [8].

Параллельно с платформой Google Scholar развивались проекты, имеющие схожие функции и назначение – CiteSeer, Scirus, Microsoft Windows Live Academic Search. Стоит отметить, что в настоящее время ни один из указанных сервисов не функционирует.

Сегодня система Google Scholar обладает широким набором практически применимых и удобных функций.

Основные возможности Google Scholar:

1. Простой и расширенный поиск научной информации.

2. Возможность выделять и сохранять заинтересовавшие статьи.

3. Возможность создавать собственные библиотеки научных статей для дальнейшего использования.

4. Автоматическое формирование корректных библиографических ссылок на научные работы.

5. Синхронизация данных с наиболее распространенными программными библиографическими менеджерами.

6. Создание профиля автора научных работ, позволяющего отслеживать личные наукометрические показатели.

7. Система автоматического оповещения о цитировании работа автора Google Scholar.

8. Надстройки Google Scholar для основных браузеров.

9. Система Google метрики, формирующая как личные наукометрические показатели ученых, так и показатели научных изданий.

10. Формирование основанных на наукометрических показателях рейтингов научных изданий.

Рассмотрим более подробно отдельные возможности системы Академия Google.

Необходимо обратить внимание на то, что использование всех возможностей системы бесплатно, однако для получения доступа к полному набору функций Google Scholar необходимо зарегистрироваться в системе Google и создать собственный аккаунт. Если пользователь уже зарегистрирован в системе Google, ему необходимо осуществить вход в базу Академии, используя существующую регистрацию.

Google Scholar позволяет осуществлять не только полнотекстовый поиск научной информации в сети Интернет, но также использовать расширенный поиск по имени автора работы, по названию издания, его тематике, аннотации, ключевым словам, дате издания, цифровому идентификатору объекта DOI и многим другим параметрам.

Академия Google предлагает ряд инструментов для работы с результатами поиска – имеется возможность выделять, отмечать заинтересовавшие пользователя статьи, реализованы функции автоматического поиска похожих статей, поиска статей аналогичной тематики, всех версий найденной статьи, поиска всех статей автора.

Из отмеченных и сохраненных статей пользователь формирует собственную библиотеку, к которой он может обратиться в любое время использования системы Академия Google. Данная функция исключает необходимость повторного поиска ранее найденной информации и позволяет существенно сэкономить время пользователя.

Google сохраняет полную историю поиска, а также позволяет отследить собственную поисковую активность, просмотреть статистику поиска по различным параметрам (время, спутниковые координаты места поиска и др.).

В Google Scholar реализована возможность автоматического формирования корректной библиографической ссылки на любую добавленную в библиотеку научную статью. Система формирует ссылки во всех наиболее часто используемых международных библиографических стандартах, таких как MLA Modern Language Association style, APA American Psychological Association style, Chicago/Turabian style, Harvard style, АCS American Chemical Society style, AIP American Institute of Physics style, IEEE Institute of Electrical and Electronics Engineers style, Vancouver style и др. Также возможно автоматическое формирование библиографических ссылок, соответствующих национальному стандарту Российской Федерации «Библиографическая ссылка» ГОСТ Р 7.0.5 – 2008.

База данных позволяет осуществлять импорт библиографических ссылок в сторонние программы и библиографические менеджеры. Реализована возможность полной синхронизации аккаунта Google Scholar с аккаунтами наиболее часто используемых менеджеров BiBTex, EndNote, RefMan, RefWorks.

Важной функцией Академии Google является возможность отслеживания цитирования собственных работ.

Для полноценного использования данной функции необходимо предоставить системе максимально полные и точные данные об ученом (фамилия, имя, отчество, место работы, должность, научные интересы, рабочий e-mail и др.), а также пройти процедуру аффилиации в системе.

После прохождения указанной процедуры Google Scholar автоматически определит перечень научных статей, автором которых является пользователь, и рассчитает его наукометрические показатели.

Основным личным наукометрическим показателем, используемым Академией Google, является h-index (индекс Хирша).

Индекс Хирша – количественная характеристика значимости публикаций автора или группы авторов. H-index находится в зависимости от количества работ автора и количества цитирований каждой из них [9].

Индекс Хирша рассчитывается следующим образом: h-index = N, если автор опубликовал N работ, каждая из которых процитирована другими учеными как минимум N раз. То есть, если автор издал 3 работы, каждая из которых процитирована 10 раз, h-index равен 3. Если автор издал 10 работ, каждая из которых процитирована 3 раза, h-index также равен 3 [10].

На сегодняшний день h-index является наиболее объективной количественной характеристикой значимости публикаций научного работника.

Система Google Scholar, используя все данные о цитировании научных работ автора, автоматически рассчитывает и сообщает пользователю его личный h-index.

Интерфейс базы данных позволяет настроить систему автоматических уведомлений, направляемых пользователю при цитировании его научных работ и при изменении его индекса Хирша.

Введение системы перекрестного цитирования каждой работы позволяет Академии Google отслеживать не только наукометрические показатели ученых, но и определять наиболее цитируемые научные издания.

На основе имеющихся данных Google Scholar рассчитывает h-index научных изданий. Индекс Хирша научных изданий рассчитывается схожим образом. H-index научного издания равен N, если в нем опубликовано N статей, каждая из которых процитирована минимум N раз. Также определяется временная производная индекса Хирша – h-медиана. Данные характеристики представляют собой объективные, основанные на статистических данных показатели работы журналов.

Но основе указанных показателей Google Scholar составляет рейтинги научных изданий. Рейтинги формируются по языковому признаку, т.е. созданы отдельные рейтинги для англоязычных, русскоязычных, немецких, китайских и иных журналов.

Рейтинг используется как авторами научных публикаций при выборе журнала для опубликования своих работ, так и различными организациями для определения авторитетности научного издания.

Рассмотрим основные положительные стороны использования поисковой и наукометрической системы Google Scholar.

– Наличие широкого набора функций для поиска, хранения, цитирования научной информации, отслеживания наукометрических показателей.

– Безвозмездность. Использование базы данных системы Google Scholar бесплатно для всех пользователей. Доступ к содержащимся в базе данных изданиям бесплатен.

– Постоянное совершенствование системы и расширение программных функций.

– Глобальность. База охватывает широкий перечень научных журналов, издающихся во всех странах мира. Мультидисциплинарность базы позволяет в рамках одной платформы искать информацию и отслеживать наукометрические показатели во всех отраслях науки.

– Индексация непериодических изданий – книг, монографий, учебных пособий, материалов конференций, сборников статей и др.

– Объективность расчета наукометрических показателей. Значительное количество индексируемых Google Scholar научных изданий позволяет получить наиболее объективные наукометрические показатели (h-index) авторов научных статей.

– Объективность рейтинга научных журналов. Значительное количество индексируемых Google Scholar научных изданий позволяет сформировать наиболее объективный перечень авторитетных научных журналов.

Представляется возможным выделить преимущества системы Google Scholar перед иными ведущими наукометрическими базами данных – Scopus, Web of Science, Российский индекс научного цитирования (РИНЦ).

Так, системы Scopus и Web of Science являются «закрытыми» системами, т.к. ими индексируются далеко не все научные издания. Зачастую недавно появившиеся активно развивающиеся научные издания не имеют возможности попасть в указанные системы. Кроме того, указанные платформы не индексируют книги, монографии, учебные пособия, научные издания по отдельным дисциплинам. Мультидисциплинарные издания указанными платформами не индексируются вовсе.

Больший охват научных изданий системой Google Scholar позволяет сформировать более объективные наукометрические показатели во всех отраслях науки.

Неоспоримым преимуществом Google Scholar является бесплатный доступ к функциям системы и к базе данных научных изданий. Доступ к базам Scopus и Web of Science предоставляется исключительно на основе платной подписки.

Преимуществом Академии Google перед системой Российского индекса научного цитирования РИНЦ является глобальность. РИНЦ на данном этапе развития по большей части охватывает научные издания России и стран СНГ. Google Scholar индексирует научную литературу, распространяемую по всему миру, что также позволяет рассчитывать более объективные количественные наукометрические показатели.

Однако наряду с положительными характеристиками системы Академия Google специалисты отмечают и отрицательные особенности работы системы.

До недавнего времени Google Scholar индексировал исключительно материалы, представленные в периодических научных изданиях. Книги, монографии, другие виды непериодических изданий в системе не индексировались, в связи с чем в настоящее время система перекрестного цитирования непериодических изданий находится в стадии формирования.

«Эффект Google Scholar». Это эффект, при котором некоторые исследователи выбирают и цитируют только те работы, которые появляются первыми в результатах поиска Google Scholar. Система ранжирования Академии Google отдает приоритет наиболее часто цитируемым работам и выводит их в верхнюю часть результатов поиска. Исследователи считают эти работы наиболее авторитетными и качественными и добавляют ссылки на них в свои труды, несмотря на то, что расположенные ниже работы могут более точно соответствовать тематике исследования [11].

Особое внимание следует обратить на рейтинги научных изданий в Академии Google. В системе реализована функция построения списка лучших журналов в различных языковых группах. Критерием построения списка является h-index журнала, рассчитанный за последние 5 лет.

На рисунке приведена информация о 15 русскоязычных научных периодических изданиях, обладающих наивысшим h-index Академии Google.

2017-10-13_153902.jpg

15 русскоязычных журналов с наивысшим h-index Google Scholar

Стоит отметить, что 3 из 15 изданий, обладающих наивысшим индексом Хирша, публикуются издательством «Академия Естествознания», что свидетельствует о высокой цитируемости журналов данного издательства.

На основе представленной в системе Google Scholar информации представляется возможным провести сравнительный анализ индекса Хирша российских и зарубежных изданий.

Одним из критериев сравнения является абсолютная величина индекса Хирша ведущего журнала в языковой группе по версии Google Scholar.

В русскоязычном сегменте научных изданий наибольшим индексом Хирша обладает журнал «Современные проблемы науки и образования» (Издательский дом «Академия Естествознания»). H-index издания равен 41.

Сравним данный показатель с ведущими изданиями других языковых групп. Наивысшим индексом Хирша в англоязычной группе журналов обладает авторитетное британское издание Nature, h-index которого составляет 366. Данный показатель является максимальным среди всех научных изданий, представленных в Google Scholar. Наличие столь высокого показателя объясняется бесспорной авторитетностью издания и универсальной языковой платформой (английский язык).

Показатели ведущих журналов иных языковых групп более ровные, столь значительной разницы показателей нет. В табл. 1 приведен перечень журналов различных языковых групп, обладающих наивысшим индексом Хирша в своем сегменте.

Таблица 1

Показатель индекса Хирша ведущих журналов основных языковых групп

п/п

Языковая группа

Название журнала

h-index

1

Английский язык

Nature

366

2

Китайский язык

经济研究 (Экономические исследования)

47

3

Португальский язык

Ciencia & Saude Coletiva

46

4

Русский язык

Современные проблемы науки и образования

41

5

Немецкий язык

Bundesgesundheitsblatt-Gesundheitsforschung-Gesundheitsschutz

34

6

Испанский язык

Comunicar

33

7

Украинский язык

Інформаційні технології і засоби навчання

19

8

Корейский язык

한국콘텐츠학회논문지 (Журнал ассоциации Кореи)

17

9

Французский язык

Annales Francaises d’Anesthesie et de Reanimation

16

10

Индонезийский язык

Speed-Sentra Penelitian Engineering dan Edukasi

16

11

Японский язык

土木学会論文集 (Гражданское делопроизводство)

14

12

Польский язык

Zeszyty Teoretyczne Rachunkowosci

12

Как видно из представленной таблицы, российский журнал «Современные проблемы науки и образования» (издательский дом «Академия Естествознания) обладает более высоким индексом Хирша, чем большинство авторитетных зарубежных изданий. Журнал опережает все немецкие, испанские, украинские, корейские, французские, индонезийские, японские и польские издания.

В табл. 2 приведены средние показатели индекса Хирша десяти ведущих журналов каждой языковой группы.

Таблица 2

Средние показатели индекса Хирша десяти ведущих журналов основных языковых групп

п/п

Языковая группа

Средний показатель индекса Хирша десяти ведущих изданий

1

Английский язык

265,3

2

Китайский язык

38,8

3

Русский язык

35,1

4

Португальский язык

31

5

Испанский язык

24,7

6

Немецкий язык

19,5

7

Украинский язык

14,6

8

Французский язык

14,1

9

Индонезийский язык

11,9

10

Польский язык

11,1

11

Корейский язык

11

12

Японский язык

10,3

Англоязычные журналы имеют столь высокие показатели благодаря универсальной языковой платформе, используемой во всем современном мире. Немного опережает российские журналы китайская публикационная система. Это объясняется распространенностью китайского языка и значительным населением КНР. Журналы российского сегмента занимают третье место в мире по среднему показателю h-index, опережая большинство языковых групп.

Данная статистика позволяет сделать вывод о положительной динамике развития российской науки в целом, о качестве научных статей, представленных в российских журналах, и о публикационной активности российских исследователей.

Статистика представляется объективной, т.к. система Google Scholar индексирует значительное количество научных изданий и признана мировым сообществом в качестве одной из ведущих наукометрических баз данных.

Стоит отметить, что система Google Scholar получила официальное признание и в Российской Федерации. Так, количество публикаций в изданиях, индексируемых системой, является одним из критериев оценки успешности научной деятельности исследователей и организаций ФАНО России. Графа «Количество публикаций в изданиях Google Scholar» включена в форму отчета о результативности деятельности научных организаций в России [2].

Таким образом, относительно новая, созданная в 2004 году, платформа Google Scholar выполняет две основные функции – поисковую и наукометрическую. Платформа постоянно совершенствуется и на сегодняшний день предлагает пользователям доступ к значительной базе данных научных изданий, а также обладает широким функционалом инструментов поиска, хранения и упорядочивания информации. Глобальность индексирования научных изданий наукометрическими инструментами Академии Google позволяет формировать объективную информацию как о личных показателях результативности научной и публикационной деятельности отдельных исследователей, так и формировать перечень наиболее авторитетных научных изданий для публикации в них научных работ. База данных Google Scholar получила официальное признание как в зарубежных странах, так и в Российской Федерации.