То, что важно лично для меня: Куда может завести "свой DSL". Часть 1. Контекст.

суббота, 7 сентября 2013 г.

Куда может завести "свой DSL". Часть 1. Контекст.

С некоторым удивлением обнаружил, что тема «своего собственного» DSL довольно популярна в блогах, да и в интернете вообще.
Из последних публикаций, которые обратили на себя моё внимание могу назвать эту и эту.
Но поиск в Google, понятно, выдаст настоящую картину.

Здесь, думаю, следует оговорится, что я имею ввиду, когда говорю «свой собственный» DSL.
Нет, речь идёт не о текучих интерфейсах и не о всепроникшем XML.
Речь идёт о настоящем языке, для которого реализован собственный интерпретатор, или построенного на базе приспособленных для этой цели Forth/Lisp.

Читая восторженные реляции по поводу такого подхода, не могу отделаться от мысли, что где-то я это уже слышал. В году эдак 1992-м...
Нетрудно вспомнить даже, от кого. От себя самого :-)

Ниже я постараюсь описать fail story, которая правда, закончилась вполне даже неплохо. Ну и поделиться выводами, которые лично я сделал.

…О! Я помню времена, когда отчёты создавались с использованием Pascal.
Тогда это был Turbo Pascal, ребрендинг на Borland ещё не случился. У нас в городе, по крайней мере. Это сейчас можно зайти в интернет и скачать (в идеале — купить) новую версию. Тогда имел место заметный временной лаг... Но я не буду отклоняться от темы.

Итак, был 1990 год, ещё был СССР, пребывавший в терминальной стадии «Перстройки».
Новые правила требовали «новой бухгалтерии», а чуть ли не главным артефактом бухгалтерии тогда (м.б. и сейчас - я далёк от этой темы) были отчёты.
У нас были данные в БД проприетарного, не совместимого ни с чем формата, были формы ввода, описанные в коде, мы работали со структурами данных (бинарными деревьями) напрямую, разумеется, у нас был набор модулей, позволявших генерировать тексты, которые затем можно было распечатать на матричном принтере, который стоил пол-«Запорожца».

Я помню, как отдавались задачи на реализацию.
Ко мне подходил коллега (который весьма далеко пошёл, к слову), брал у меня исходные тексты (сети уже были, IOLA – если кто помнит, и Novell, но нашей организации они были не по карману) и шёл писать код.
Через пару дней (иногда — больше, поскольку отчёты были разной сложности), он выдавал готовый отчёт, который я подключал к проекту, собирал его, и в проекте появлялась новая функциональность.

Так продолжалось достаточно долго, по нынешним меркам — год или два. Сейчас уже трудно точно сказать — сколько времени прошло.
Кстати, я тоже тогда был весьма молодым человеком, просто специализация у меня была другая. Зачем я это пишу? - Для того, чтобы обозначить контекст тех событий, которые случились позже.

В какой-то момент на семинарах (в нашей организации были семинары) стали появляться темы, связанные с генератором отчётов. Слушал я «вполуха», поскольку своих проблем было предостаточно. Но кое-что вспомнить (восстановить) могу.

К тому моменту мы уже использовали реляционную СУБД без SQL. Да, так бывает :-)
В качестве СУБД использовалась отечественная разработка - HyTech, которая жива и сегодня. К слову - неплохая вещь была, особенно, по тем временам. По скорости выполнения проекций она и сегодня даст фору любому Oracle, правда на тех объёмах которые она поддерживала - 16 млн. записей. Инвертированные файлы - это серьёзно. Для тех задач, где их можно применить ;-) Не для СУБД... :-)

Одной из неприятных проблем, с которыми приходилось сталкиваться при разработке отчётов было то, что Pascal, вообще-то, не очень подходит для генерации и обработки текста.
Все такие задачи, сводящиеся к «жонглированию» строчками, в реализации оказывались непростыми, особенно, если вспомнить, что предоставлял из себя Pascal тогда.
К вашим услугам была конкатенация строк, вставка, удаление символов и «гениальная» функция Pos, которая могла искать только с начального символа строки, длина которой была ограничена 255 символами.
Негусто. Никаких вам параграфов «бесконечного размера». Форматирование? - Реализуйте сами. Ну, мы и реализовали. Много чего нареализовывали.
Я это к тому, что задачи форматирования текста и его разбиения на страницы, с колонтитулами, с итогами по странице, вкупе с ограничениями на количество оперативной памяти 640 KB «реального» режима, при немалом размере оверлейного приложения и постоянной «паранойи» относительно количества используемой алгоритмами памяти, оказывались весьма непростыми в реализации.

В какой-то момент возник совершенно справедливый вопрос. Как так получается, что задачи, которые описываются сравнительно ограниченным набором понятий:

Абзац
Шаблон (некий аналог макета — того, что можно за пять минут сделать в любом интерактивном дизайнере отчётов)
Страница (с нумерацией, колонтитулами и итогами)

приводит к таким (существенным) затратам труда при реализации?

Чтобы стали понятны некоторые детали "той логики", мне нужно кое-что пояснить.
Как я сказал уже выше, разнообразие функциональности по работе со строками в Pascal было не очень большим, с PChar работать было вообще неудобно, если не сказать - опасно, ввиду чего работа с абзацами (тогда мы не использовали этот термин, вообще, система понятий была несколько иной, я вынужден подбирать нечто похожее из современного, чтобы не утомлять читателя) "заворачивалась" в классы-обёртки, но всё равно, возни с форматированием было намного больше, чем бы хотелось.
И мы были вынуждены экономить память. Жёстко, брутально.
Когда памяти мало, она начинает фрагментироваться (понятно, что связь - непрямая) и становится совсем худо.
Постоянные мысли о необходимости экономить приводили к тому, что для нас дикостью выглядело формирование абзаца целиком в куче, после чего его можно было бы подставить, скажем, в ячейку таблицы. - Нет, это привело бы к необходимости перераспределения этой кучи при достижении границы текущего отведённого под хранение абзаца блока, фрагментации и... Ну понятно, в общем.
Поэтому мы видели формирование отчёта исключительно по строкам. Сверху-вниз. Строка за строкой. И так до конца страницы, когда управление должно было быть передано коду, занимающемуся формированием нижних колонтитулов, в которых должны были отображаться пресловутые итоги по странице.
Разумеется, при появлении новой страницы, сначала "печатались" верхние колонтитулы. Когда появлялась новая страница? - А когда производилась попытка вывода в неё первой строки.
Ну понятно, что строка таблицы и строка отчёта - разные вещи. Приходилось "крутиться". В частности, с итогами по странице, которые уверенно "пили кровь". Но они встречались нечасто, что и спасало.
DPMI же стало возможным использовать только через год или два, когда до нас дошла техника, где стало возможным его применение. Это - существенно.
Ну и, кроме всего прочего, бытовала уверенность, что формирование отчёта по строчкам текстового файла - это адекватный подход к генерации отчётов.
Эх... Было бы возможным вернуться в то время, я бы смог убедить себя самого, что лучше уж было применить буферизацию и хранить формируемые абзацы во временных файлах (если они становились бы слишком большими), поддержать таблицы в явном виде, т.е. в виде соответствующих классов: таблица, колонки, строки, в которые можно было бы вставлять абзацы... Но... Время анизотропно... :-)
Ладно, на суть того, что я хочу донести, это не влияет ни в малейшей степени. Даже лучше, что получилось так, как получилось.
Итак, я надеюсь, что дал некое объяснение тому, почему решено было формировать отчёт по строкам текстового файла, который и был результатом выполнения отчёта.

Но удобным форматированием вкупе с построчной генерацией отчётов наши пожелания не исчерпывались.

Неудобным было пересобирать приложение при подключении/или изменении реализации отчёта. В рамках реализации их с помощью модулей на Pascal проблема не решалась.
Экзотические пути с реализацией отчётов в виде отдельных исполняемых файлов мы отбросили и, я считаю, что правильно сделали.

Наконец, была вожделенная мечта. Дать возможность конечному пользователю самостоятельно составлять отчёты, в которых он испытывал потребность.
Квалифицированные пользователи (как правило, это были администраторы) были всегда. Ну, по крайней мере, в среде наших клиентов. Иногда были даже целые отделы программистов.
Но если отчёты - равноправная часть программы, то пользователю придётся отдавать её исходный код, что по ряду причин - совсем не comme il faut. И дело даже не в наших "секретах". Создавать отчёты - одно, а вмешиваться в логику приложения, к чему пользователь, по факту, получал бы доступ в таком случае - это виделось неприемлемым как тогда, так и сейчас.

Итак, как виделась задача тогда.
Проблемы, которые следовало решить в контексте "нового" генератора отчётов:

Удобное форматирование текста, основанное на шаблонах. Так, чтобы не приходилось возиться со строками.
"Прозрачное" разделение на страницы с поддержкой колонтитулов и итогов.
Отделение реализаций отчётов от основного приложения
Обеспечение возможности пользователю создавать свои отчёты и, при необходимости, вносить изменения в отчёты, реализованные нами (компанией-разработчиком)

Вся совокупность означенных требований хорошо ложилась в концепцию собственного специализированного и очень простого языка программирования, который посредством использования естественных понятий предметной области (генерация отчётов по реляционной БД) позволит с минимальными затратами труда создавать прекрасные отчёты, в некоторых случаях освобождая наших сотрудников от этой рутины, путём привлечения к созданию отчётов самого клиента.
Такой язык был создан.

Продолжение следует...

35 комментариев :

Alex W. Lulin7 сентября 2013 г. в 18:35
HyTech ;-)

Знакомо.
ОтветитьУдалить
Ответы
Alex W. Lulin7 сентября 2013 г. в 18:51
"Я это к тому, что задачи форматирования текста и его разбиения на страницы, колонтитулами, итогами по странице, вкупе с ограничениями на количество оперативной памяти 640 KB «реального» режима при немалом размере оверлейного приложения и постоянной «паранойи» относительно количества используемой алгоритмами памяти, оказывались весьма непростыми в реализации."

Примерно в то же время, и в тех же 640 К был написан текстовый редактор, который редактировал мегабайты текста :-) вполне успешно.
ОтветитьУдалить
Ответы
Alex W. Lulin7 сентября 2013 г. в 19:16
Но HyTech это ведь не 92-й год? И тем более не 90-й? Ближе к 94-95-му мне кажется. Да?
ОтветитьУдалить
Ответы
Alex W. Lulin7 сентября 2013 г. в 19:20
https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%81%D1%83%D0%B6%D0%B4%D0%B5%D0%BD%D0%B8%D0%B5:%D0%A1%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0_%D1%83%D0%BF%D1%80%D0%B0%D0%B2%D0%BB%D0%B5%D0%BD%D0%B8%D1%8F_%D0%B1%D0%B0%D0%B7%D0%B0%D0%BC%D0%B8_%D0%B4%D0%B0%D0%BD%D0%BD%D1%8B%D1%85

"Занятное" там обсуждение :-(
ОтветитьУдалить
Ответы
Alex W. Lulin7 сентября 2013 г. в 20:43
"Было бы возможным вернуться в то время, я бы смог убедить себя самого, что лучше уж было применить буферизацию и хранить формируемые абзацы во временных файлах (если они становились бы слишком большими), поддержать таблицы в явном виде, т.е. в виде соответствующих классов: таблица, колонки, строки, в которые можно было бы вставлять абзацы..."

Это мы сделали, но уже в 95-м году :-)
ОтветитьУдалить
Ответы
Alex W. Lulin7 сентября 2013 г. в 21:07
"при немалом размере оверлейного приложения"

Я что-то путаю, или оверлеи к тому моменту были "отменены"? После TP 4.0.

Просто я сам пытаюсь вспомнить - у нас вроде тоже были оверлеи. А википедия говорит - уже "отменили".
ОтветитьУдалить
Ответы