Поиск

Как искать научные статьи по медиации?

При написании рефератов и курсовых работ, при подготовке научных статей перед исследователями встает вопрос как искать научную информацию и делать это правильно?


Дисклеймер: приводимый далее текст принадлежит издательству АНО ДПО "Институт Мира и исследования конфликтов"! При копировании, распространении текста ссылка на эту страницу обязательна!


Давайте разберемся на конкретном примере.


Рассмотрим Научную электронную библиотеку (https://www.elibrary.ru), которая обладает не только достаточно мощным поисковым механизмом, но и некоторым набором аналитических инструментов. В исследовательских целях использовался следующий расширенный поисковый запрос:


Строка поиска (тело запроса): медиация.


Где искать: в названии публикации, в аннотации, в ключевых словах (выбор позволяет исключить из подборки публикации с единичными включениями в текст публикации используемых в запросе термин-концептов, тем самым уменьшив объем подборки и актуализировав состав подборки — термин-концепты, встречающиеся в аннотации, ключевых словах и заголовке документа определяют значимые для тематики исследования контексты), в списках цитируемой литературы (данную опцию следует задавать при построении запроса, если предполагается проследить «историю» вопроса, выявить публикации соответствующие как тематике исследования в целом, так и контекстам использования термин-концепта).

Тип публикации: статьи в журналах, книги, материалы конференций, диссертации (набор определяется научным интересом, задачами и спецификой направления исследований).

Параметры: искать с учетом морфологии.

Полнотекстовый поиск не был использован по ряду причин: из-за особенностей обработки полнотекстовых запросов в Elibrary и связанного с этим эмпирического экспертного заключении о попадании в отобранный корпус большого количества текстов, слабо релевантных заданной тематике или текстов, встречаемость искомого термина в котором является единичным и контекстно незначимым.

Годы публикаций: с 2016 по 2020 гг. Текущий год для анализа динамики лучше не брать, так как массив документов по нему является неполным. Для общего анализа текстов текущий год можно включить.

После выполнения поискового запроса было получено 5762 публикации, которые были сохранены в соответствующую подборку, что упрощает дальнейшую экспликацию и анализ. Дальнейшая экспликация была проведена через расширенный поиск публикаций в этой подборке с ограничением по годам. Полученный результат представлен в таб. 2.2.



Визуализация полученных данных в MS Excel показывает неуклонный рост публикаций (рис. 2.1), что в целом говорит об актуальности научных исследований по медиации.



Далее был проведён анализ тематики исследований по сформированной подборке. Для этого в подборке был выбран пункт «Анализ публикаций в данной подборке» и статистический отчёт «Распределение публикаций по тематическим рубрикам» (рис. 2.2).


Для наглядности (и использования в публикации, отчёте или в ВКР) можно построить круговую диаграмму средствами MS Excel (рис. 2.3)


Для выявления развития тематик по направлению исследований, связанных с медиацией, из подборки публикаций произведём экспликацию публикаций с распределением по годам и составим таблицу с распределением по годам публикаций по тематическим направлениям. По полученным данным построим результирующий график (рис. 2.4), из которого видно, что наиболее значимыми и стабильными тематиками являются: «Государство и право. Юридические науки», «Народное образование. Педагогика», «Психология» и «Социология». Самую высокую актуальность на протяжении всего периода сохраняет направление «Государство и право. Юридические науки», что говорит о востребованности исследований применения медиации в этой области.




Для выявления терминологической базы эксплицируем полученную подборку для получения более релевантного массива научных публикаций. При этом определимся с более узкой тематикой применения медиации, а именно — при разрешении конфликтов. Поэтому произведём расширенный поиск в новой подборке по медиации за период с 2016 по 2021 год, которая включает в себя 6074 документа с применением поискового запроса «конфликт». Результаты запроса — это 2170 документов. Теперь в аналитических отчётах выберем статистический отчёт «Распределение публикаций из подборки по ключевым словам». Полный список содержит достаточно большое число терминов — более 1000.

Необходимо отметить, что:

  1. не все описания публикаций сопровождаются списком ключевых слов;

  2. список содержит ключевые слова как на русском, так и на английском (или иных) языках (например, МЕДИАЦИЯ и MEDIATION);

  3. в списке ключевых слов встречаются синонимы (например, МЕДИАТОР, ПОСРЕДНИК) или различные словоформы (например, АЛЬТЕРНАТИВНОЕ РАЗРЕШЕНИЕ СПОРОВ и АЛЬТЕРНАТИВНЫЕ СПОСОБЫ РАЗРЕШЕНИЯ СПОРОВ).

Эти обстоятельства говорят о том, что при формировании терминологической базы необходимо пользоваться экспертным методом и на основе собственного анализа принимать решение о включении терминов в тезаурус. Также необходимо принимать во внимание абсолютную частоту встречаемости терминов в подборке документов и выставить некоторый порог, ниже которого термины рассматривать нецелесообразно. Помимо этого, на этапе анализа терминологической базы желательно распределять термины по семантическим группам, которые отражают тематические направления рассматриваемого междисциплинарного направления научных исследований. Так, например, можно предложить следующее распределение (таб. 2.2).

Формирование терминологической базы позволяет решать ряд задач в рамках проводимого исследования:

  • более чётко определять предмет и объект исследования;

  • выявлять общие для различных тематик термины;

  • выявлять синонимичные термины, что позволит производить более рациональный поиск научной литературы;

  • составлять списки термин-концептов, которые можно использовать как в поисковых запросах, так и в качестве опорных терминов при контекстном анализе в соответствующих информационных системах и программных платформах.




Одной из важных задач исследования является формирование релевантных тематических коллекций контекстов. Коллекции могут быть сформированы:

  1. на уровне коллекций документов (корпусных контекстов), которые затем будут загружены в соответствующие информационные системы для последующей экспликации и анализа контекстного знания. При этом по соответствующим запросам из цифровых научных ресурсов отбираются документы и из них формируются корпусы текстов с разбивкой по годам. Это позволяет анализировать динамику развития тематических направлений и терминологической базы проводимого исследования;

  2. тематические коллекции контекстов (контекстов типа фрагмент), которые представляют собой результаты выполнения расширенных тематических (например, «многослойных» в T-Libra или коллокаций в других инструментах) запросов. Такой запрос позволяет сформировать несколько поисковых «строк», или «слоев», каждый из которых может представлять какой-либо «аспект» интересующей пользователя темы, а также задать дополнительные параметры тематической фокусировки запроса. Результатом поиска является список абзацев, содержащих в своем составе заданную пользователем терминологическую структуру, «тему». А набор релевантных тематическому направлению исследования результатов выполнения запросов представляет собой тематические коллекции контекстов (абзацев). Далее на основе анализа коллекций контекстов возможно решение задач по обоснованию актуальности темы исследования, определению объекта и предмета исследования, поиску определений базовых понятий. Эти же коллекции контекстов являются базой для подготовки аналитических обзоров, научных статей и отчётов.

Наиболее распространённым является анализ корпусных контекстов, которые формируются на этапе поиска и экспликации контекстного знания в полнотекстовых базах научной информации. Например, в предыдущем подразделе описан процесс формирования подборки научных публикаций по медиации применительно в сфере разрешения конфликтов за период с 2016 по 2021 годы с использованием Научной электронной библиотеки (6074 документа). В эту подборку включены публикации, у которых может быть доступен полный текст, но его может и не быть — содержатся только метаданные, либо это закрытый контент (например, по решению правообладателя).

Произведём расширенный поиск в этой подборке, выбрав фильтры «искать в публикациях, имеющих полный текст на eLibrary.Ru» и «искать в публикациях, доступных для Вас». После этой экспликации получаем всего 740 документов. Но в каждом описании есть возможность скачать полный текст в формате PDF. Для этого есть два способа — либо скачивать отдельно каждый документ, либо воспользоваться программным интерфейсом пользователя, API (который предоставляется НЭБ на коммерческой основе). После получения корпуса текстов необходимо проверить, что все они представлены с текстовым слоем. И, при необходимости, произвести распознавание текста в документах (как правило, это несколько документов). Иначе их невозможно использовать для автоматизированного анализа в соответствующих программных системах. Для распознавания можно использовать следующие программные средства: Adobe Acrobat Pro, Foxit Phantom, ABBYY FineReader или любую стороннюю утилиту. В итоге должен получиться либо файл PDF с текстовым слоем, либо текстовый файл в одном из распространённых форматов (TXT, RTF, DOC). После всех подготовительных манипуляций получившийся корпус текстов готов для загрузки и анализа в любую информационную систему или программную платформу для автоматизированного анализа контекстного знания.


14 просмотров0 комментариев

Недавние посты

Смотреть все