Написание отчётов и статей (рекомендации)

Материал из MachineLearning.

(Различия между версиями)
Перейти к: навигация, поиск
м
Строка 20: Строка 20:
=== Аннотация ===
=== Аннотация ===
-
Краткое описание темы исследования и основного результата, одним абзацем на 5–15 строк, без формул и специальных терминов.
+
Краткое описание темы исследования и основного результата, одним абзацем на 5–15 строк, без формул, без ссылок на литературу, без узкоспециальных терминов.
'''Цель''' аннотации: обозначить в общих чертах, о чем работа.
'''Цель''' аннотации: обозначить в общих чертах, о чем работа.
Строка 55: Строка 55:
=== Определения и обозначения ===
=== Определения и обозначения ===
Формальная постановка задачи.
Формальная постановка задачи.
-
Для известных понятий желательно придерживаться стандартных обозначений и употреблять общепринятые термины.
+
Для известных понятий желательно придерживаться стандартных обозначений.
-
Здесь же автор может вводить и новые обозначения.
+
Общепринятые термины вводятся словом «называется».
 +
Термины, придуманные самим автором, вводятся словами «назовём» или «будем называть».
Обычно этот раздел заканчивается формальной постановкой задачи.
Обычно этот раздел заканчивается формальной постановкой задачи.
Строка 86: Строка 87:
'''Цель''' данного раздела:
'''Цель''' данного раздела:
-
продемонстрировать, что предложенная теория работает на практике.
+
продемонстрировать, что предложенная теория работает на практике;
 +
показать границы её применимости;
 +
рассказать о новых экспериментальных фактах.
Чисто теоретические работы могут не содержать данного раздела
Чисто теоретические работы могут не содержать данного раздела
(не работает, ну и не надо — зато теория красивая).
(не работает, ну и не надо — зато теория красивая).
Строка 108: Строка 111:
'''Цель''' данного раздела: доказать квалификацию автора.
'''Цель''' данного раздела: доказать квалификацию автора.
-
Даже беглого взгляда на заключение должно быть достаточно, чтобы понять:
+
Даже беглого взгляда на заключение должно быть достаточно, чтобы стало ясно:
-
автору удалось решить актуальную, сложную задачу, и предложенные им решения верны.
+
автору удалось решить актуальную, трудную, ранее не решённую задачу,
 +
предложенные автором решения обоснованы и проверены.
Кстати, в отзывах и рецензиях это выражается примерно такими словами:
Кстати, в отзывах и рецензиях это выражается примерно такими словами:
Строка 167: Строка 171:
Алгебраисты более формальны, геометры — более интуитивны.
Алгебраисты более формальны, геометры — более интуитивны.
Первые быстрее воспринимают язык формул, вторые предпочитают воспринимать идеи,
Первые быстрее воспринимают язык формул, вторые предпочитают воспринимать идеи,
-
вникая в технические подробности только в случае крайней необходимости.
+
вникая в технические подробности только в случае необходимости.
Автор должен позаботиться о том, чтобы его текст был понятен и той, и другой категории читателей,
Автор должен позаботиться о том, чтобы его текст был понятен и той, и другой категории читателей,
Строка 173: Строка 177:
=== Неформальные объяснения и интерпретации ===
=== Неформальные объяснения и интерпретации ===
-
Формальное изложение (гипотезы, определения, леммы, теоремы, следствия) должно перемежаться неформальными объяснениями, интерпретациями, замечаниями, примерами, апеллирующими к интуиции и здравому смыслу.
+
Формальное изложение (гипотезы, определения, леммы, теоремы, следствия, замечания) должно перемежаться неформальными объяснениями, интерпретациями, замечаниями, примерами, апеллирующими к интуиции и здравому смыслу.
Однако оформляться это должно так, чтобы читатель сразу понял:
Однако оформляться это должно так, чтобы читатель сразу понял:
«вот тут закончились доказательства и начались интерпретации».
«вот тут закончились доказательства и начались интерпретации».
Строка 193: Строка 197:
Изложение основной части должно быть структурировано, то есть разбито на блоки (параграфы, разделы).
Изложение основной части должно быть структурировано, то есть разбито на блоки (параграфы, разделы).
Каждый блок должен решать более-менее обособленную задачу.
Каждый блок должен решать более-менее обособленную задачу.
-
Должно быть объявлено, зачем она решается, и почему она решается именно так.
+
В начале блока должно быть объявлено, зачем она решается, и почему она решается именно так.
Чтобы ответить на вопрос «зачем», надо вспомнить общую цель всего исследования.
Чтобы ответить на вопрос «зачем», надо вспомнить общую цель всего исследования.
Чтобы ответить на вопрос «почему так», надо сделать обзор литературы.
Чтобы ответить на вопрос «почему так», надо сделать обзор литературы.
Строка 204: Строка 208:
В начале неформально объясняется постановка задачи и её роль во всем исследовании (или в объемлющем разделе).
В начале неформально объясняется постановка задачи и её роль во всем исследовании (или в объемлющем разделе).
В заключении неформально объясняется, что получилось, и как это интерпретировать.
В заключении неформально объясняется, что получилось, и как это интерпретировать.
 +
Если в следующих разделах полученный результат будет улучшен, об этом стоит упомянуть.
Средняя часть может быть целиком формальной.
Средняя часть может быть целиком формальной.
Строка 231: Строка 236:
'''Наблюдение:''' «казенные» тексты напичканы абстрактными глаголами.
'''Наблюдение:''' «казенные» тексты напичканы абстрактными глаголами.
 +
 +
=== Семь раз прочти, один раз отправь ===
 +
На самом деле семь раз — это мало.
 +
Обычно студент, пишущий свою первую статью, не отдаёт себе отчёта в том, сколько ляпов будет сделано по невнимательности.
 +
Почти в каждой фразе!
 +
Это нормально, людям свойственно ошибаться.
 +
Ещё многим людям свойственно не замечать собственных ошибок.
 +
Поэтому стадию '''внимательного вычитывания''' ни в коем случае пропускать нельзя.
 +
 +
'''Рекомендация:''' если есть возможность, заранее оставьте себе целый день на многократное внимательное прочтение своего труда. К вечеру он начнёт Вам нравиться, и Вы поймёте, что день прожит не зря.
== Дело техники ==
== Дело техники ==

Версия 19:32, 12 июля 2008

Содержание

Приведённые ниже рекомендации по поготовке статей, отчётов, квалификационных работ адресованы, главным образом, студентам и аспирантам.

Введение

Во всем мире научные статьи пишут по определенным канонам, выработанным многими поколениями учёных. Традиции в данном случае необходимы для того, чтобы разные люди без дополнительных усилий понимали друг друга. Чем жёстче требования к терминологии, языку, форме подаче материала, оформлению, тем меньше читатель отвлекается на второстепенные детали, тем быстрее он сможет понять основную суть работы. Пренебрегать этими традициями — значит быть неадекватным в глазах сообщества.

Всякая научная статья преследует одновременно две цели:

  • донести основные идеи автора до широкой аудитории так, чтобы не-специалисты в данной узкой теме смогли понять основные идеи, затратив на это минимум времени;
  • представить детальное изложение полученных результатов так, чтобы небольшое число узких специалистов смогли их понять, перепроверить, развить и применить.

О том, как писать научные статьи именно в области машинного обучения, здорово рассказано в заметке Пэта Лэнгли Crafting Papers on Machine Learning. К отчетам и выпускным работам изложенные там соображения тоже относятся в полной мере.

Типичная структура научной статьи

Аннотация

Краткое описание темы исследования и основного результата, одним абзацем на 5–15 строк, без формул, без ссылок на литературу, без узкоспециальных терминов.

Цель аннотации: обозначить в общих чертах, о чем работа. Прочитав аннотацию в течение минуты, не-специалист в данной узкой теме должен понять, интересна ли ему эта работа, и стоит ли читать дальше.

Аннотация собирается в последнюю очередь путем легкой модификации ключевых фраз (наиболее важных и удачно сформулированных) из введения и заключения.

Введение

Во введении рассказывается, где возникает данная задача, и почему ее решение так важно. Вводится на неформальном уровне минимум терминов, необходимый для понимания постановки задачи. Приводится краткий анализ источников информации (литературный обзор): как эту задачу решали до сих пор, в чем недостаток этих решений, и что нового предлагает автор. Формулируются цели исследования. В конце введения даётся краткое содержание работы по разделам; при этом отмечается, какие подходы, методы, алгоритмы предлагаются автором впервые. При упоминании ключевых разделов кратко формулируются основные результаты и наиболее важные выводы.

Цель введения: дать достаточно полное представление о выполненном исследовании и полученных результатах, понятное широкому кругу специалистов. Большинство читателей прочтут именно введение и, быть может, заключение. Во введении автор решает сложную оптимизационную проблему: как сообщить только самое важное, потратив минимум времени читателя, да так, чтобы максимум читателей поняли, о чём вообще идёт речь.

Введение лучше писать напоследок, так как в ходе работы обычно происходит переосмысление постановки задачи. Если же введение писать, когда работа еще не готова, задача усложняется вдвойне. В конце обычно приходит понимание, что всё получилось совсем не так, как планировалось в начале, и исходный вариант введения всё равно придётся переписывать. Кстати, к таким «потерям» надо относиться спокойно — в хорошей работе почти каждый абзац многократно переделывается до неузнаваемости.

Определения и обозначения

Формальная постановка задачи. Для известных понятий желательно придерживаться стандартных обозначений. Общепринятые термины вводятся словом «называется». Термины, придуманные самим автором, вводятся словами «назовём» или «будем называть». Обычно этот раздел заканчивается формальной постановкой задачи.

Именно с этого раздела стоит начинать писать статью.

Известные результаты

Перечисляются подходы, методы, факты, на которые существенно опирается данная работа, но которые могут быть не известны широкому кругу читателей. Здесь ссылки на литературу обязательны. Теоремы только формулируются, но не доказываются.

Цели данного раздела. Во-первых, сделать статью самодостаточной — дать необходимый минимум информации тем читателям, которые не очень хорошо ориентируются в теме, но желают поближе познакомиться именно с данной работой. Во-вторых, облегчить сопоставление полученных автором результатов с ранее известными.

Новые подходы и результаты

Один или несколько разделов — основные результаты, полученные автором. Собственно, ради их опубликования и пишется весь текст. Теоремы приводятся с доказательствами.

Вычислительный эксперимент

Описывается прикладная задача, параметры анализируемых данных (например, сколько объектов, сколько признаков, и каких они типов), параметры эксперимента (например, как производился скользящий контроль). Результаты экспериментов представляются в виде таблиц и графиков. Объясняется точный смысл всех обозначений на графиках, строк и столбцов в таблицах. Приводятся выводы: в какой степени результаты экспериментов согласуются с теорией? Достигнут ли желаемый результат? Обнаружены ли какие-либо факты, не нашедшие объяснения, и которые нельзя списать на «грязный» эксперимент?

Цель данного раздела: продемонстрировать, что предложенная теория работает на практике; показать границы её применимости; рассказать о новых экспериментальных фактах. Чисто теоретические работы могут не содержать данного раздела (не работает, ну и не надо — зато теория красивая). Кстати, теоретики имеют право не догадываться, где, кому и когда их теории пригодятся.

Обсуждения и выводы

Основные отличия предложенных методов от известных ранее. В чем их преимущества? Каковы границы их применимости? Какие проблемы удалось решить, а какие остались открытыми? Какие возникли новые постановки задач?

Заключение или основные результаты

В квалификационных работах последний раздел нужен для того, чтобы конспективно перечислить основные результаты, полученные лично автором. Результатами, в частности, являются:

  • Предложен новый подход к…
  • Разработан новый метод…, позволяющий…
  • Доказан ряд теорем, подтверждающих (опровергающих), что…
  • Экспериментально показано, что…

Цель данного раздела: доказать квалификацию автора. Даже беглого взгляда на заключение должно быть достаточно, чтобы стало ясно: автору удалось решить актуальную, трудную, ранее не решённую задачу, предложенные автором решения обоснованы и проверены.

Кстати, в отзывах и рецензиях это выражается примерно такими словами: «работа удовлетворяет всем требованиям, предъявляемым к [бакалаврским, магистерским, дипломным, кандидатским — ненужное вычеркнуть] диссертациям; автор достоин присуждения ему звания [бакалавра, магистра, и т.д.]».

Благодарности

Ссылки на гранты; реже — благодарности коллегам, подсказавшим важные идеи.

Литература

Дурным тоном считается:

  • ссылаться на работы только одного-двух авторов (например, себя или шефа);
  • ссылаться на слишком малое число работ;
  • ссылаться только на очень старые работы;
  • ссылаться на работы, которых автор ни разу не видел;
  • вообще ни на что не ссылаться.

Некоторые принципы и приёмы ясного изложения

Время читателя — ценнейший ресурс

Эталоном неясного изложения будем считать «казённый язык» — сухой, скучный, трудно понимаемый, но при этом формально абсолютно корректный (бесспорно, существуют образцы ещё более ужасного изложения; однако здесь обсуждается проблема, как из хорошего сделать лучшее). «Казённым» стилем обычно пишутся законы, руководства и инструкции. В советские времена в таком стиле писали газеты. Таким стилем все ещё пишут некоторые ученые… Но это неправильно.

Автор должен стремиться экономить время читателей хотя бы потому, что он один, а читателей много.

Краткость — сестра таланта

Фразы должны быть короткими. В каждой фразе должна быть ровно одна мысль. В русской фразе (кстати, как и в английской) самое важное слово, значимость которого хочется подчеркнуть особо, ставится последним. Обратите внимание на положение слов «особо» и «последним» в предыдущей фразе. Теперь ясно, что имеется в виду?

Наблюдение: в «казенных» текстах фразы длинные, содержат по несколько мыслей, и наиболее значимое слово прячется в середине.

Не надо пытаться сказать одну мысль несколькими разными способами. Нужно оставить только один, самый лучший, способ.

Наблюдение: в гуманитарных текстах (например, в Библии) делается наоборот — одна и та же мысль повторяется многократно, но в разных формах. Чтобы каждый смог осознать её в той форме, которая лично ему ближе.

В техническом тексте нет необходимости украшать содержание разнообразием форм, так как его цель — передача знания, а не ощущения.

Комментирование формул

Текст, содержащий формулы, должен оставаться в целом понятным, если его читать, просто пропуская все формулы. Это означает, что каждая формула должна сопровождаться комментарием, объясняющим её содержательный смысл, или поясняющим, чем она интересна, или для чего она будет нужна в дальнейшем.

Наблюдение. Математики делятся на две категории. «Алгебраисты» быстро понимают и хорошо запоминают формулы. «Геометры» предпочитают понимать содержательный смысл высказываний. Алгебраисты более формальны, геометры — более интуитивны. Первые быстрее воспринимают язык формул, вторые предпочитают воспринимать идеи, вникая в технические подробности только в случае необходимости.

Автор должен позаботиться о том, чтобы его текст был понятен и той, и другой категории читателей, то есть дошёл до максимально широких слоев профессионального сообщества.

Неформальные объяснения и интерпретации

Формальное изложение (гипотезы, определения, леммы, теоремы, следствия, замечания) должно перемежаться неформальными объяснениями, интерпретациями, замечаниями, примерами, апеллирующими к интуиции и здравому смыслу. Однако оформляться это должно так, чтобы читатель сразу понял: «вот тут закончились доказательства и начались интерпретации». В англоязычных статьях в этом месте принято вставлять раздел Discussion (обсуждение).

Наблюдение. Эпоха чисто формальных текстов в прикладной математике ушла в прошлое. Их понимание требует в несколько раз больших затрат времени. Темп жизни вырос, и если статью не удается понять за пару часов, то вернуться к ней уже не будет возможности. Однако любой результат можно изложить понятно. Этому можно и нужно научиться.

Основные идеи текста должны быть в целом понятны, если целиком пропускать доказательства. Вывод: если внутри доказательства спрятана важная идея, то её обсуждение стоит вынести за пределы доказательства. Например, можно разбить доказательство на леммы.

Структуризация

Изложение основной части должно быть структурировано, то есть разбито на блоки (параграфы, разделы). Каждый блок должен решать более-менее обособленную задачу. В начале блока должно быть объявлено, зачем она решается, и почему она решается именно так. Чтобы ответить на вопрос «зачем», надо вспомнить общую цель всего исследования. Чтобы ответить на вопрос «почему так», надо сделать обзор литературы.

Наблюдение. В маргинальных исследованиях вопросы «зачем» и «почему так» либо не ставятся, либо на них даются невнятные (неконкретные, слишком философские) ответы.

Каждый раздел, независимо от уровня и объема, строится по одному и тому же сценарию. В начале неформально объясняется постановка задачи и её роль во всем исследовании (или в объемлющем разделе). В заключении неформально объясняется, что получилось, и как это интерпретировать. Если в следующих разделах полученный результат будет улучшен, об этом стоит упомянуть. Средняя часть может быть целиком формальной.

Важный принцип: изложение в целом должно быть понятным, если средние части во всех разделах целиком опустить.

Жёсткая последовательность

Каждая следующая фраза должна вытекать непосредственно из предыдущей. Слишком жестко? Тогда хотя бы 95% фраз. Следить за линейной логикой изложения на порядок менее утомительно, чем за перескоками с темы на тему. Резкая смена темы должна оформляться в явном виде как новый параграф, раздел, подраздел.

Любой термин или обозначение должны быть введены до первого использования, даже если они общеупотребительны. Это вроде бы очевидно, но по неопытности трудно уследить за каждой закорючкой.

Наблюдение. В учебниках и хороших книгах таких грубых ошибок не бывает — благодаря тому, что эти тексты десятки раз вычитываются авторами, рецензентами и редакторами.

Глаголы

За точность смысла отвечают глаголы. Тщательный подбор одного единственного глагола иногда способен заменить пару строк простанных комментариев. Старайтесь не употреблять слишком абстрактных глаголов является, имеется, позволяет, поддерживает, применяется, и т.п. Это легкомысленная расточительность такого ценного ресурса, как глаголы. Ведь в каждой фразе глагол только один.

Наблюдение: «казенные» тексты напичканы абстрактными глаголами.

Семь раз прочти, один раз отправь

На самом деле семь раз — это мало. Обычно студент, пишущий свою первую статью, не отдаёт себе отчёта в том, сколько ляпов будет сделано по невнимательности. Почти в каждой фразе! Это нормально, людям свойственно ошибаться. Ещё многим людям свойственно не замечать собственных ошибок. Поэтому стадию внимательного вычитывания ни в коем случае пропускать нельзя.

Рекомендация: если есть возможность, заранее оставьте себе целый день на многократное внимательное прочтение своего труда. К вечеру он начнёт Вам нравиться, и Вы поймёте, что день прожит не зря.

Дело техники

Для оформления научных статей, отчётов, квалификационных работ, учебных курсов, книг рекомендуется освоить издательскую систему LaTeX.

  • Памятка по установке и использованию MiKTeX и WinEdt.
  • LaTeX в примерах — сборник примеров, помогающий довольно быстро освоить LaTeX в объеме, достаточном для написания первой статьи.

Ссылки

Литература