Участник:Khar
Материал из MachineLearning.
м (→НОВАЯ Тема: ГИПЕРКОМПЛЕКСНЫЕ ЧИСЛА) |
|||
(176 промежуточных версий не показаны.) |
Текущая версия
Харинов Михаил Вячеславович
ктн, доц., c.н.с. Санкт-Петербургского ин-та информатики и автоматизации РАН (СПИИРАН).
Содержание |
Тема: ОПТИМАЛЬНАЯ КЛАСТЕРИЗАЦИЯ
Здесь можно скачать программу вычисления иерархии приближений полутонового изображения Иерархическим методом Оцу, а также тестовые результаты для стандартного изображения Лена. Комментарий: Эту программу можно будет применять для эффективного детектирования объектов, если добавить в нее управляющий параметр, который задает базисное число тонов в изображении. В данной предварительной версии параметр фиксирован и равен 2.
ПРИМЕЧАНИЕ:
В подразделе выше выложены несколько программ, созданных в процессе разработки, так называемой, Shcolar-модели детектирования объектов на цветовом изображении. Программы написаны в авторском стиле с "защитой от дурака". Этот стиль за счет встроенного самотестирования обеспечивает: а) исключение ошибок программирования; б) возможность вернуться к редактированию программы через несколько лет. Программы написаны в разные годы в структуре данных, которая совершенствовалась по мере разработки. Для непосредственного практического использования программ требуются очевидные доработки. Но сами доработки, по завершению построения содержательной Shcolar-модели и ее вычислительной версии в терминах Алгебраической многослойной сети (АМС-сети), утрачивают прежнюю актуальность. При готовой модели разумней программировать детектирование объектов дедуктивно "от нуля", в фиксированной структуре данных, пользуясь ключевыми модулями представленных программ, а также статьями и консультациями автора. М.В. Харинов 2021 г.
Kharinov M. Scholar Model of Images, Objects and Superpixels in Questions and Answers Комментарий: Это заготовка позиционной статьи про математическую модель изображения, его элементов (суперпикселей) и объектов на изображении, которую планируется напечатать в приличном зарубежном журнале.
Kharinov M. Scholar Model of Images, Objects and Superpixels in Questions and Answers Комментарий: Это заготовка позиционной статьи про математическую модель изображения, его элементов (суперпикселей) и объектов на изображении, которую планируется напечатать в приличном зарубежном журнале.
Mikhail Kharinov Clustering for Detection of Binary Object Hierarchy Using Modernized Classical Clustering Methods // Pattern Recognition and Information Processing (PRIP'2021) : Proceedings of the 15th International Conference, 21–24 Sept. 2021, Minsk, Belarus. – Minsk : UIIP NASB, 2021. pp. 198–201. Статья: https://prip.by/2021/assets/files/papers/2124092021PRIP_proceedings_B5-6.pdf ВидеоПрезентации: https://www.youtube.com/watch?v=0clNRv9D5wI&start=4156&autoplay=1 .
Kharinov M.V. Superpixel Clustering // 2020 International Russian Automation Conference (RusAutoCon), 05-11 Sept. 2021, Sochi, Russia, IEEE Publisher, 2021, pp. 303-308. DOI: 10.1109/RusAutoCon52004.2021.9537461 URL: https://ieeexplore.ieee.org/abstract/document/9537461 Комментарий: В статьях дано строгое определение суперпикселей, т.е. элементарных множеств пикселей,из которых состоит изображение и объекты, детектируемые компьютером. В следующих статьях будет описываться математическая модель детектирования объектов в целом.
Харинов М.В. Минимизация ошибки аппроксимации структурированного изображения кусочно–постоянными приближениями // Математические методы распознавания образов (ММРО-2019) / Тезисы докладов 19-й Всероссийской конференции с международным участием, М.: Россйская академия наук, 26-29 ноября 2019. C. 159–164.
Доклад на русском и английском Презентация на русском, на английском,DOI: 10.13140/RG.2.2.18755.35363
Комментарий: В презентации дано строгое определение суперпикселей, т.е. элементарных множеств пикселей, из которых состоит изображение и объекты, детектируемые компьютером.
Kharinov M., Buslavsky A. Object Detection in Color Image // Pattern Recognition and Information Processing (PRIP’2019) / Proceedings of the 14th International Conference. — Minsk: Publishing Center of BSU, 21–23 May 2019, pp. 43–47.
DOI:10.13140/RG.2.2.28493.28640 (Presentation)
Комментарий: В докладе и презентации прогнозируется отставание на 5-10 лет России от США в области создания инструментария для изготовления программ ИИ, в частности, ПО компьютерного зрения. Ожидается, что требуемый инструментарий изготовят в США и выложат в открытый доступ, чтобы снизить стоимость разработки программных продуктов.
Комментарий: Статья с некоторыми деталями вычислений.
Харинов М.В., Ханыков И. Г. Применение метода Уорда для кластеризации пикселей цифрового изображения // Вестник Бурятского государственного университета. Математика, информатика. Улан-Удэ: Изд-во Бурятского госуниверситета, 2016. №4. — С. 34-42. — ISSN 2304-5728
Комментарий: Статья - про то, как быстро сосчитать иерархию кластеров по Уорду.
Kharinov M.V. Reversible Image Merging for Low-level Machine Vision, arXiv preprint, http://arxiv.org/abs/1604.03832
Комментарий: Статьи - про модель изображения и объектов.
Харинов М.В., Ханыков И.Г. Комбинированный метод улучшения сегментации изображения // Вестник Бурятского государственного университета. Cерия Математика и информатика / №9, Улан-Удэ: Изд-во Бурятского госуниверситета, 2015. — С. 118-124. — ISSN 1994-0866
Комментарий: Статья представляет практическую реализацию комбинированного глобально-локального метода улучшения качества сегментации в актуальном приложении выделения объектов на изображениях, снятых в различном ракурсе.
Харинов М.В., Ханыков И.Г. Оптимизация кусочно-постоянного приближения сегментированного изображения // Труды СПИИРАН. 2015. Вып. 3(40). С. 183–202.
Комментарий: В статье теоретически и экспериментально обосновывается классическая оценка качества разбиения в приложении к кластеризации пикселей и сегментации изображения. Методы улучшения сегментации разделяются на глобальные и локальные. Обсуждается унифицированный алгоритм глобального улучшения сегментации цветового изображения, названный SI-методом.
Комментарий: Статья - про алгоритм улучшения сегментации изображения тривиальным методом слияния/разделения сегментов. Обеспечивает эффект метода K-средних или более сильного метода С.Д. Двоенко "K-средних без средних". Но, в отличие от методов K-средних, сохраняет число сегментов в разбиении. Не тривиальна программная реализация в терминах динамических деревьев Слейтора-Тарьяна.
Харинов М.В., Заболотский В.П. Критическая технология квазиоптимального машинного зрения // Информатизация и связь / №3, 2014. — М., С. 43-46.
Комментарий: Статья с минимумом формул и упором на обобщение постановки задачи сегментации (на выходе не единственное разбиение изображения, а последователь- ность разбиений), и задачи оптимизации (на выходе — квазиоптимальные разбиения, которые, в отличие от оптимальных разбиений, составляют иерархическую последователь- ность. Плюс генерация автоматических меток объектов). Минимум ссылок, в том числе — на работы С.Д. Двоенко.
Харинов М.В. Кластеризация пикселей для сегментации цветового изображения // Компьютерная графика и зрение (Графикон’2014) / Труды 24-й международной конференции по компьютерной графике и зрению, Ростов-на-Дону: Академия архитектуры и искусств ЮФУ, 30 сентября – 3 октября 2014 г., С. 123–126.
Комментарий: в статье представлен алгоритм иерархической квазиоптимальной кластеризации/сегментации, который обеспечивает реальную минимизацию суммарной квадратичной ошибки при заранее заданном ограничении на число сегментов в кластерах. Приводится формула суммирования квадратичных ошибок при слиянии нескольких кластеров пикселей. Эта формула обобщает выражение квадратичной ошибки для кластера из отдельных пикселей, которое в различных приложениях кластерного анализа используется в трудах Сергея Даниловича Двоенко.
Комментарий: в статье наш метод квазиоптимальной иерархической кластеризации пикселей и сегментации изображения обобщается на случай цветовых изображений. Кластеризация пикселей серого изображения выполняется так же эффективно, как в иерархическом методе Оцу. В отличие от метода Оцу, наш метод остается применимым для цветового изображения.
Харинов М.В. Hierarchical pixel clustering for image segmentation, arXiv preprint, http://arxiv.org/abs/1401.5891
Комментарий: в статье предлагается метод квазиоптимальной (близкой к оптимальной) иерархической сегментации изображения посредством кластеризации пикселей. Сначала выполняется квазиоптимальная кластеризация, а затем уменьшается число сегментов в кластерах при контролируемом сопутствующем снижении качества разбиений изображения.
Харинов М.В. Image segmentation by optimal and hierarchical piecewise constant approximations, arXiv preprint, http://arxiv.org/abs/1306.2159
Комментарий: в статье задается вопрос, - нельзя ли оптимальные приближения изображения аппроксимировать иерархическими? Ответ положительный.
1) Харинов М.В. Обобщение трех подходов к оптимальной сегментации цифрового изображения // Труды СПИИРАН. 2013. Вып. 2(25). С. 294–316.
Комментарий: Первая статья без картинок — про две операции с кластерами пикселей: a)слияние кластеров и b)реклассификацию части пикселей из одного кластера в другой, с подробным описанием формул в порядке их получения без громоздких выкладок. Во второй статье вводится третья операция — с)дробление кластера, и все три операции иллюстрируются на примере оптимизации разбиений изображения на связные сегменты.
Харинов М.В. Reclassification formula that provides to surpass K–means method, arXiv preprint, http://arxiv.org/ftp/arxiv/papers/1209/1209.6204.pdf
Комментарий: статья про элементарную формулу, которая в упрощенном виде приводит к методу k-средних, а без упрощения, к более сильному методу кластеризации, который состоит в непосредственной реклассификации подмножества элементов из одного кластера в другой, минуя стадию вычисления центров кластеров.
Тема: СТРУКТУРА ДАННЫХ ДЛЯ МУЛЬТИ-СЕГМЕНТАЦИИ ИЗОБРАЖЕНИЙ
Харинов М.В. Разработка динамических структур данных системы автоматизированного распознавания изображений: Автореф. Дис. канд. технич. наук: 05-13-16 — С.П. 1993. — 20 с.
Харинов М.В. Разработка динамических структур данных системы автоматизированного распознавания изображений: Дис. канд. технич. наук: 05-13-16 — С.П. 1993. — 178 с.
Комментарий: диссертация о том, как работать с многочисленными разбиениями, когда изображение не помещается в оперативной памяти. Расчеты выполнялись в терминах динамических деревьев Слэйтора-Тарьяна и редуцируемой "таблицы связности". В современной нотации динамические деревья Слейтора-Тарьяна обозначаются также терминами "Disjoint sets", "Persistent data structures" и "Splay tree".
Тема: ПСЕВДОТРОИЧНАЯ СИСТЕМА СЧИСЛЕНИЯ
Харинов М.В. Недвоичная логика запоминания информации в изображении // 50 лет модулярной арифметике / Матер. межд. конф. 2005. — 8 с.
Харинов М.В. Псевдотроичная система счисления и анализ изображений // Труды СПИИРАН / Под ред. Р. М. Юсупова, Вып. 1, т. 2. – СПб, СПИИРАН 2002. – С. 269-275.
Комментарий: о системе экономичного кодирования иерархии разбиений значениями пикселей некоторого матричного представления изображения.
Тема: МОДЕЛЬ СИГНАЛА С ЦИФРОВОЙ ПАМЯТЬЮ
1) Харинов М.В. Information quantity in a pixel of digital image, arXiv preprint, http://arxiv.org/abs/1401.7517
2) Харинов М.В. Hierarchical pixel clustering for image segmentation, arXiv preprint, http://arxiv.org/abs/1401.5891
Комментарий: первая статья — о целочисленном количестве информации в пикселе изображения, которое определяется для квазиоптимальной иерархии кластеров пикселей, вторая статья — о построении квазиоптимальной иерархии кластеров пикселей или связных сегментов изображения.
Харинов М.В., Заболотский В.П. Стеганографическая защита документов на основе модели запоминания информации изображения // Информация и связь / №1, 2010. — М., — С. 77-81.(см. также статьи М.В.Харинова в выпусках 1(2), 2(1), 3(2), 4 и 7 Трудов СПИИРАН)
Комментарий: статья про информацию, которую можно записать в сигнал и потом извлечь из сигнала, обладающего определенной емкостью собственной памяти. Доступная емкость памяти сигнала позволяет оценить в битах количество информации, которую можно записать в сигнал. Соответствующая целочисленная оценка количества информации получается в предположении, что при приеме известен только алгоритм записи сообщения в сигнал. Ни исходный сигнал, ни встроенное сообщение заранее не известны. Основной результат состоит в том, что полученная оценка совпадает с классическими. Важно, что количество информации при этом оценивается вне связи со сжатием данных.
Тема: ПЕРЕСТАНОВОЧНАЯ СИММЕТРИЯ
M. V. Kharinov Natural non-group symmetry in modern applications // Proceedings of MIP Computing-V 2022: V International Scientific Workshop on Modeling, Information Processing and Computing, January 25, 2022, Krasnoyarsk, Russia, vol. 3091, pp. 60-65б DOI: 10.47813/dnit-mip5/2022-3091-38-45 Комментарий: Очередная статья в открытом доступе по перестановочной симметрии матриц.
Комментарий: Это первая после патента СССР № 1799274 серьезная статья в рецензируемом (индексируемом и пр.) журнале. В 1990 г. предполагалось начать с патентования игрушек, а затем раскрыть их научный смысл. Однако, до этой темы дошли руки только сейчас...
Авилов Н.И. Симметричные пиктограммы Харинова // Математика, 2018. №4 С.63.
Комментарий: статья о головоломках по патенту СССР № 1799274.
Харинов М.В. Перестановочная и скрытая симметрия на примере изоморфных матриц Адамара. Приложения в области искусственного интеллекта // Средства математического моделирования / Труды Второй межд. конф. — С.-П.: изд-во СПбГТУ, 1999. T.5 — С 247-254.
Комментарий: статья о том, как изобрести игры типа тех, что предложены в патенте СССР № 1799274.
НОВАЯ Тема: ГИПЕРКОМПЛЕКСНЫЕ ЧИСЛА
Планируемые разделы:
1) АППАРАТ: обобщение векторного произведения на случай трех аргументов для кватернионов и октав.
Kharinov M.V. ,Product of three octonions,Subjects: Mathematics. Rings and Algebras (math.RA), 16 Jan 2018. — 10 p.
Щемелева И.С., Харинов М.В. ,ПРОИЗВЕДЕНИЕ ТРЕХ ВОСЬМИМЕРНЫХ ГИПЕРКОМПЛЕКСНЫХ ЧИСЕЛ (ОКТАВ) // Научное сообщество студентов: МЕЖДИСЦИПЛИНАРНЫЕ ИССЛЕДОВАНИЯ: сб. ст. по мат. XXXVI междунар. студ. науч.-практ. конф. № 1(36). - версия статьи на русском языке
Комментарий: статья полезна для желающих поработать с 8-мерными гиперкомплексными числами (октавами). Все знают, что произведение двух гиперкомплексных чисел раскладывается в сумму антикоммутатора и коммутатора (векторного произведения). Аналогичное разложение нетрудно ввести также и для трех гиперкомплексных чисел. Однако, оно не стало пока общеупотребительным, так как автор - Susumu Okubo представил разложение в незавершенной форме.
2) РАЗЛОЖЕНИЕ ЛИНЕЙНЫХ ПРЕОБРАЗОВАНИЙ НА СИММЕТРИЧНЫЕ И АНТИСИММЕТРИЧНЫЕ КОМПОНЕНТЫ:
Kharinov M.V. , Symmetry of the triple octonionic product,Subjects: Mathematics. Rings and Algebras (math.RA), 14 Jun 2018. — 14 p.
Комментарий: в статье предлагается обобщение общеизвестного эрмитова разложения оператора на симметричную и кососимметричную (антисимметричную) части, которое иллюстрируется на примере произведения 4-мерных кватернионов, или 8-мерных октав справа и слева на центральный аргумент. Как и в предыдущей статье, рассматривается обобщение векторного произведения на случай трех аргументов, для которого предлагается дополнительное обоснование из соображений симметрии. Имеется вариант статьи на русском, который можно получить по запросу. Kharinov M.V. , Symmetry of the triple octonionic product, Subjects: Mathematics. Rings and Algebras (math.RA), 14 Jun 2018. — 14 p.
Kharinov M.V. , Product of Three Octonions // Adv. Appl. Clifford Algebras, Springer Nature Switzerland AG, 29(1), 2018. — 16 p. (Published on line 08 December 2018),doi: 10.1007/s00006-018-0928-x
Комментарий: улучшенная версия предыдущих двух статей в авторитетном журнале, индексируемом в WoS. Еще пара таких публикаций, и можно будет по этой теме публиковаться в Российских журналах, относимых к рецензируемым.
Kharinov M.V. , Sketch on quaternionic Lorentz transformations // International Conference on Polynomial Computer Algebra (PCA’2019), St.Petersburg: Russian Academy of Sciences, St.Petersburg Department of Steklov Mathematical Institute,St.Petersburg Electrotechnical University "LETI", April 15-20, 2019, P. 71–74.
Комментарий: пилотная статья про преобразования Лоренца (в законченном виде см. демонстрацию к FERT-2019). Статья содержит сведения, которых не хватает в справочниках и Википедии. Из-за ограниченного объема чересчур лаконична. Дополнительные формулы можно посмотреть в одноименной презентации.
Примечание: PCA'2008-PCA'2019 — это элитарная международная ленинградская математическая конференция, на которой удалось отметиться в качестве гостя.
Харинов М.В. Квартет собственных векторов для композиции лоренцевских бустов в пространстве кватернионов // XV Международная конференция Финслеровы обобщения теории относительности (FERT-2019). Материалы конференции, Москва, Российский университет дружбы народов, 24–26 октября 2019, С. 195 –200.
DOI: 10.13140/RG.2.2.11847.04001 (презентация)
3) ПРИЛОЖЕНИЯ(если успею):
3.1 Обобщение преобразований Лоренца на 8-мерное пространство октав или октонионов (англ.).
doi:10.26855/jamc Комментарий: статья про композицию бустов Лоренца. В терминах скалярных произведений выписано выражение для композиции бустов через ее собственные вектора. Требуется переписать это выражение, пользуясь кватернионным умножением. Вероятно, должна получиться лаконичная формула, которая подскажет как именно следует обобщать преобразования Лоренца на случай октонионов.
doi: 10.1007/s00006-020-1050-4
Комментарий: статья про преобразования Лоренца. Cодержит сведения, которых не хватает в справочниках и Википедии. Еще одна такая публикация, и можно будет по этой теме публиковаться в Российских журналах, относимых к рецензируемым.
Kharinov M.V. Eigenvalues and eigenvectors for the composition of Lorentz boosts in concise form // International Conference on Polynomial Computer Algebra (PCA’2021), St.Petersburg: Russian Academy of Sciences, St.Petersburg Department of Steklov Mathematical Institute,St.Petersburg Electrotechnical University "LETI", April 12-17, 2020, P. 74–77.
Видео выступления на конференции со слайдами презентации.
Видео - то же самое в YouTube.
Комментарий: решение задачи на собственные значения/вектора. Результат выражается различными эквивалентными формулами. Здесь они в наиболее лаконичной форме.
3.2 Цветовое преобразование цифровых изображений
МОНОГРАФИИ
Kharinov M.V. Proved Image Segmentation, Chapter 10 in book: Image Processing: Methods, Applications and Challenges /Ed. Vítor Hugo Carvalho, New York: Nova Science Publishers, Inc., 2012.—pp.207-227.(ISBN: 978-1-62081-844-2).
Комментарий: сводка результатов по оптимальной сегментации цифрового изображения по состоянию на 2011 г.
Харинов М.В. Запоминание и адаптивная обработка информации цифровых изображений / Под ред. Р.М. Юсупова. — СПб.: Изд-во С.Петерб. ун-та, 2006. — 138 с. (ISBN: 5-288-04209-8, монография по проекту РФФИ 06-07-95007).
Комментарий: первая глава - про псевдотроичную систему счисления, следующие три главы - про стеганографическое встраивание в изображение произвольных сообщений, пятая глава - про распознавание объектов в терминах динамических деревьев.
ПАТЕНТЫ
Здесь можно скачать презентацию серии игр по патенту СССР № 1799274. Комментарий: Игры отличаются тем, что: а)пользователь, играя в очередную игру, изготавливает детали игрового конструктора для следующей игры; б)сложность игры регулируется добавлением или исключением элементов деталей конструктора; в)механические игрушки выигрывают по сравнению с электронными, т.к. для того, чтобы начать играть в электронную игру, требуется представить себе механическую.
Здесь можно скачать игру по патенту СССР № 1799274.
Комментарий: Забавно, что эвристические игры этого типа спустя десяток лет пришли в Россию из Японии и получили название "Симметриксы". Так что у нас "Симметриксы из СССР".
МАТЕРИАЛЫ ПО СЕРИИ ИГР "ДАЛЬТОРАДУГА" - прямой доступ
МАТЕРИАЛЫ ПО СЕРИИ ИГР "ДАЛЬТОРАДУГА"
Харинов М.В. Цветовая логическая игра-головоломка "Дальторадуга", патент СССР № 1799274 от 31.10.1990 г., опубл. 28.02.1993. Бюл. № 8.
Комментарий: речь идет о серии развивающих игр, в том числе — электронной игре с перестановочной симметрией. В настоящее время в работе новая игра в виде настольного конструктора, которую продвигают школьники в Литве.
1) Харинов М.В. Двухкомпонентное встраивание сообщений в изображение, совместный патент РФ от СПИИРАН–«Самсунг Электроникс Ко., Лтд.» № 2331085, опубл. 10.08.2008 в офиц. Бюлл. Пат. ведомства РФ № 22. — 31 с.
2) Харинов М.В. Адаптивное встраивание водяных знаков по нескольким каналам, совм. патент РФ от СПИИРАН–«Самсунг Электроникс Ко., Лтд.» № 2329522, опубл. 20.07.2008 в офиц. Бюлл. Пат. ведомства РФ № 20. — 41 с.
Комментарий: пара патентов по стеганографии, главный — второй, впрочем, его тоже давно следовало бы обновить...
Redkov V., Tikotski A., Luciv V., Potapov A., Averkin A., Kharinov M. Mobile robot and the method of location recognization, заявка KR2012-0124909 от 06 ноября 2012 г. на корейский патент от компании LG.
Комментарий: заявка объединяет несколько решений. Решение, разработанное с участием автора, называется "Fast Adaptive Binary-wise Hierarchical Segmentation Method for Detection of Linear Objects".