Написание отчётов и статей (рекомендации)

Материал из MachineLearning.

Перейти к: навигация, поиск

Содержание

Приведённые ниже рекомендации по поготовке статей, отчётов, квалификационных работ адресованы, главным образом, студентам и аспирантам.

Введение

Во всем мире научные статьи пишут по определенным канонам, выработанным многими поколениями учёных. Традиции в данном случае необходимы для того, чтобы разные люди без дополнительных усилий понимали друг друга. Чем жёстче требования к терминологии, языку, форме подаче материала, оформлению, тем меньше читатель отвлекается на второстепенные детали, тем быстрее он сможет понять основную суть работы. Пренебрегать этими традициями — значит быть неадекватным в глазах сообщества.

Всякая научная статья преследует одновременно две цели:

  • донести основные идеи автора до широкой аудитории так, чтобы не-специалисты в данной узкой теме смогли понять основные идеи, затратив на это минимум времени;
  • представить детальное изложение полученных результатов так, чтобы небольшое число узких специалистов смогли их понять, перепроверить, развить и применить.

О том, как писать научные статьи именно в области машинного обучения, здорово рассказано в заметке Пэта Лэнгли Crafting Papers on Machine Learning. К отчетам и выпускным работам изложенные там соображения тоже относятся в полной мере.

Типичная структура научной статьи

Аннотация

Краткое описание темы исследования и основного результата, одним абзацем на 5–15 строк, без формул и специальных терминов.

Цель аннотации: обозначить в общих чертах, о чем работа. Прочитав аннотацию в течение минуты, не-специалист в данной узкой теме должен понять, интересна ли ему эта работа, и стоит ли читать дальше.

Аннотация собирается в последнюю очередь путем легкой модификации ключевых фраз (наиболее важных и удачно сформулированных) из введения и заключения.

Введение

Во введении рассказывается, где возникает данная задача, и почему ее решение так важно. Вводится на неформальном уровне минимум терминов, необходимый для понимания постановки задачи. Приводится краткий анализ источников информации (литературный обзор): как эту задачу решали до сих пор, в чем недостаток этих решений, и что нового предлагает автор. Формулируются цели исследования. В конце введения даётся краткое содержание работы по разделам; при этом отмечается, какие подходы, методы, алгоритмы предлагаются автором впервые. При упоминании ключевых разделов кратко формулируются основные результаты и наиболее важные выводы.

Цель введения: дать достаточно полное представление о выполненном исследовании и полученных результатах, понятное широкому кругу специалистов. Большинство читателей прочтут именно введение и, быть может, заключение. Во введении автор решает сложную оптимизационную проблему: как сообщить только самое важное, потратив минимум времени читателя, да так, чтобы максимум читателей поняли, о чём вообще идёт речь.

Введение лучше писать напоследок, так как в ходе работы обычно происходит переосмысление постановки задачи. Если же введение писать, когда работа еще не готова, задача усложняется вдвойне. В конце обычно приходит понимание, что всё получилось совсем не так, как планировалось в начале, и исходный вариант введения всё равно придётся переписывать. Кстати, к таким «потерям» надо относиться спокойно — в хорошей работе почти каждый абзац многократно переделывается до неузнаваемости.

Определения и обозначения

Формальная постановка задачи. Для известных понятий желательно придерживаться стандартных обозначений и употреблять общепринятые термины. Здесь же автор может вводить и новые обозначения. Обычно этот раздел заканчивается формальной постановкой задачи.

Именно с этого раздела стоит начинать писать статью.

Известные результаты

Перечисляются подходы, методы, факты, на которые существенно опирается данная работа, но которые могут быть не известны широкому кругу читателей. Здесь ссылки на литературу обязательны. Теоремы только формулируются, но не доказываются.

Цели данного раздела. Во-первых, сделать статью самодостаточной — дать необходимый минимум информации тем читателям, которые не очень хорошо ориентируются в теме, но желают поближе познакомиться именно с данной работой. Во-вторых, облегчить сопоставление полученных автором результатов с ранее известными.

Новые подходы и результаты

Один или несколько разделов — основные результаты, полученные автором. Собственно, ради их опубликования и пишется весь текст. Теоремы приводятся с доказательствами.

Вычислительный эксперимент

Описывается прикладная задача, параметры анализируемых данных (например, сколько объектов, сколько признаков, и каких они типов), параметры эксперимента (например, как производился скользящий контроль). Результаты экспериментов представляются в виде таблиц и графиков. Объясняется точный смысл всех обозначений на графиках, строк и столбцов в таблицах. Приводятся выводы: в какой степени результаты экспериментов согласуются с теорией? Достигнут ли желаемый результат? Обнаружены ли какие-либо факты, не нашедшие объяснения, и которые нельзя списать на «грязный» эксперимент?

Цель данного раздела: продемонстрировать, что предложенная теория работает на практике. Чисто теоретические работы могут не содержать данного раздела (не работает, ну и не надо — зато теория красивая). Кстати, теоретики имеют право не догадываться, где, кому и когда их теории пригодятся.

Обсуждения и выводы

Основные отличия предложенных методов от известных ранее. В чем их преимущества? Каковы границы их применимости? Какие проблемы удалось решить, а какие остались открытыми? Какие возникли новые постановки задач?

Заключение или основные результаты

В квалификационных работах последний раздел нужен для того, чтобы конспективно перечислить основные результаты, полученные лично автором. Результатами, в частности, являются:

  • Предложен новый подход к…
  • Разработан новый метод…, позволяющий…
  • Доказан ряд теорем, подтверждающих (опровергающих), что…
  • Экспериментально показано, что…

Цель данного раздела: доказать квалификацию автора. Даже беглого взгляда на заключение должно быть достаточно, чтобы понять: автору удалось решить актуальную, сложную задачу, и предложенные им решения верны.

Кстати, в отзывах и рецензиях это выражается примерно такими словами: «работа удовлетворяет всем требованиям, предъявляемым к [бакалаврским, магистерским, дипломным, кандидатским — ненужное вычеркнуть] диссертациям; автор достоин присуждения ему звания [бакалавра, магистра, и т.д.]».

Благодарности

Ссылки на гранты; реже — благодарности коллегам, подсказавшим важные идеи.

Литература

Дурным тоном считается:

  • ссылаться на работы только одного-двух авторов (например, себя или шефа);
  • ссылаться на слишком малое число работ;
  • ссылаться только на очень старые работы;
  • ссылаться на работы, которых автор ни разу не видел;
  • вообще ни на что не ссылаться.

Некоторые принципы и приёмы ясного изложения

Время читателя — ценнейший ресурс

Эталоном неясного изложения будем считать «казённый язык» — сухой, скучный, трудно понимаемый, но при этом формально абсолютно корректный (бесспорно, существуют образцы ещё более ужасного изложения; однако здесь обсуждается проблема, как из хорошего сделать лучшее). «Казённым» стилем обычно пишутся законы, руководства и инструкции. В советские времена в таком стиле писали газеты. Таким стилем все ещё пишут некоторые ученые… Но это неправильно.

Автор должен стремиться экономить время читателей хотя бы потому, что он один, а читателей много.

Краткость — сестра таланта

Фразы должны быть короткими. В каждой фразе должна быть ровно одна мысль. В русской фразе (кстати, как и в английской) самое важное слово, значимость которого хочется подчеркнуть особо, ставится последним. Обратите внимание на положение слов «особо» и «последним» в предыдущей фразе. Теперь ясно, что имеется в виду?

Наблюдение: в «казенных» текстах фразы длинные, содержат по несколько мыслей, и наиболее значимое слово прячется в середине.

Не надо пытаться сказать одну мысль несколькими разными способами. Нужно оставить только один, самый лучший, способ.

Наблюдение: в гуманитарных текстах (например, в Библии) делается наоборот — одна и та же мысль повторяется многократно, но в разных формах. Чтобы каждый смог осознать её в той форме, которая лично ему ближе.

В техническом тексте нет необходимости украшать содержание разнообразием форм, так как его цель — передача знания, а не ощущения.

Комментирование формул

Текст, содержащий формулы, должен оставаться в целом понятным, если его читать, просто пропуская все формулы. Это означает, что каждая формула должна сопровождаться комментарием, объясняющим её содержательный смысл, или поясняющим, чем она интересна, или для чего она будет нужна в дальнейшем.

Наблюдение. Математики делятся на две категории. «Алгебраисты» быстро понимают и хорошо запоминают формулы. «Геометры» предпочитают понимать содержательный смысл высказываний. Алгебраисты более формальны, геометры — более интуитивны. Первые быстрее воспринимают язык формул, вторые предпочитают воспринимать идеи, вникая в технические подробности только в случае крайней необходимости.

Автор должен позаботиться о том, чтобы его текст был понятен и той, и другой категории читателей, то есть дошёл до максимально широких слоев профессионального сообщества.

Неформальные объяснения и интерпретации

Формальное изложение (гипотезы, определения, леммы, теоремы, следствия) должно перемежаться неформальными объяснениями, интерпретациями, замечаниями, примерами, апеллирующими к интуиции и здравому смыслу. Однако оформляться это должно так, чтобы читатель сразу понял: «вот тут закончились доказательства и начались интерпретации». В англоязычных статьях в этом месте принято вставлять раздел Discussion (обсуждение).

Наблюдение. Эпоха чисто формальных текстов в прикладной математике ушла в прошлое. Их понимание требует в несколько раз больших затрат времени. Темп жизни вырос, и если статью не удается понять за пару часов, то вернуться к ней уже не будет возможности. Однако любой результат можно изложить понятно. Этому можно и нужно научиться.

Основные идеи текста должны быть в целом понятны, если целиком пропускать доказательства. Вывод: если внутри доказательства спрятана важная идея, то её обсуждение стоит вынести за пределы доказательства. Например, можно разбить доказательство на леммы.

Структуризация

Изложение основной части должно быть структурировано, то есть разбито на блоки (параграфы, разделы). Каждый блок должен решать более-менее обособленную задачу. Должно быть объявлено, зачем она решается, и почему она решается именно так. Чтобы ответить на вопрос «зачем», надо вспомнить общую цель всего исследования. Чтобы ответить на вопрос «почему так», надо сделать обзор литературы.

Наблюдение. В маргинальных исследованиях вопросы «зачем» и «почему так» либо не ставятся, либо на них даются невнятные (неконкретные, слишком философские) ответы.

Каждый раздел, независимо от уровня и объема, строится по одному и тому же сценарию. В начале неформально объясняется постановка задачи и её роль во всем исследовании (или в объемлющем разделе). В заключении неформально объясняется, что получилось, и как это интерпретировать. Средняя часть может быть целиком формальной.

Важный принцип: изложение в целом должно быть понятным, если средние части во всех разделах целиком опустить.

Жёсткая последовательность

Каждая следующая фраза должна вытекать непосредственно из предыдущей. Слишком жестко? Тогда хотя бы 95% фраз. Следить за линейной логикой изложения на порядок менее утомительно, чем за перескоками с темы на тему. Резкая смена темы должна оформляться в явном виде как новый параграф, раздел, подраздел.

Любой термин или обозначение должны быть введены до первого использования, даже если они общеупотребительны. Это вроде бы очевидно, но по неопытности трудно уследить за каждой закорючкой.

Наблюдение. В учебниках и хороших книгах таких грубых ошибок не бывает — благодаря тому, что эти тексты десятки раз вычитываются авторами, рецензентами и редакторами.

Глаголы

За точность смысла отвечают глаголы. Тщательный подбор одного единственного глагола иногда способен заменить пару строк простанных комментариев. Старайтесь не употреблять слишком абстрактных глаголов является, имеется, позволяет, поддерживает, применяется, и т.п. Это легкомысленная расточительность такого ценного ресурса, как глаголы. Ведь в каждой фразе глагол только один.

Наблюдение: «казенные» тексты напичканы абстрактными глаголами.

Дело техники

Для оформления научных статей, отчётов, квалификационных работ, учебных курсов, книг рекомендуется освоить издательскую систему LaTeX.

  • Памятка по установке и использованию MiKTeX и WinEdt.
  • LaTeX в примерах — сборник примеров, помогающий довольно быстро освоить LaTeX в объеме, достаточном для написания первой статьи.

Ссылки

Литература