Sync from GitHub with Git LFS

Files changed (2) hide show

agents/tools/db_structure.sql +10 -6
docs/HMP-agent-REPL-cycle.md +27 -11

agents/tools/db_structure.sql CHANGED Viewed

@@ -133,13 +133,17 @@ CREATE TABLE IF NOT EXISTS llm_memory (
     llm_id TEXT                                                 -- Идентификатор LLM
 );
--- Краткосрочная память (диалоговая история)
 CREATE TABLE IF NOT EXISTS llm_recent_responses (
-    id INTEGER PRIMARY KEY AUTOINCREMENT,                       -- Уникальный идентификатор
-    timestamp DATETIME DEFAULT CURRENT_TIMESTAMP,               -- Время сообщения
-    role TEXT CHECK(role IN ('user', 'assistant')) NOT NULL,    -- Роль автора
-    content TEXT NOT NULL,                                      -- Содержимое сообщения
-    llm_id TEXT                                                 -- Идентификатор LLM
 );
 -- Список известных агентов в сети HMP

     llm_id TEXT                                                 -- Идентификатор LLM
 );
+-- Краткосрочная память (диалоговая история с рефлексией)
 CREATE TABLE IF NOT EXISTS llm_recent_responses (
+    id INTEGER PRIMARY KEY AUTOINCREMENT,
+    timestamp DATETIME DEFAULT CURRENT_TIMESTAMP,
+    role TEXT CHECK(role IN ('user', 'assistant')) NOT NULL,
+    content TEXT NOT NULL,                      -- Содержимое сообщения
+    llm_id TEXT,                                -- Идентификатор LLM
+    reflection TEXT,                            -- Краткая сводка/мета-комментарий
+    novelty_score REAL,                         -- Количественная оценка новизны
+    new_ideas JSON,                             -- JSON-список новых идей
+    discarded_ideas JSON                        -- JSON-список отбракованных идей
 );
 -- Список известных агентов в сети HMP

docs/HMP-agent-REPL-cycle.md CHANGED Viewed

@@ -2,6 +2,8 @@
 Структура БД, используемая в документе: [db_structure.sql](https://github.com/kagvi13/HMP/blob/main/agents/tools/db_structure.sql)
 ## 1. Обновление process_log
 * Скрипт REPL проверяет список процессов в БД (`process_log`), определяя, какие команды были выполнены, завершились ошибкой или завершились успешно.
@@ -11,6 +13,8 @@
 * Скрипт может удалить закрытые процессы при очистке.
 * LLM не имеет доступа к stdout/stderr напрямую — только к тем результатам, которые были подгружены скриптом и внесены в `process_log.result`.
 ## 2. Подготовка контекста
 Контексты, формируемые скриптом перед запросом к LLM:
@@ -39,7 +43,7 @@
   * Это не просто лог предыдущих сообщений, а именно *внутреннее долговременное хранилище* разума агента.
   * Может быть представлено в виде таблицы `llm_memory`, отдельной от `agent_log`.
-* **контекст_7:** результат работы `anti-Stagnation Reflex` из предыдущей итерации
 ## 3. Запрос к LLM
@@ -47,6 +51,8 @@
 * Также включаются инструкции о формате вывода (например, `# Команды:` в конце, структура JSON-блока и т.д.).
 * При необходимости может использоваться системная инструкция (system prompt), содержащая цель агента, ограничения и текущий REPL-режим (manual/auto).
 ## 4. Извлечение команд
 * Скрипт парсит ответ LLM на предмет команд, размеченных как `# Команды:` (или в явном JSON-блоке).
@@ -89,21 +95,31 @@
 * для управления *настройками цикла*: количество возвращаемых записей `llm_recent_responses`, режим обработки сообщений пользователя (`manual` или `auto`) и фильтр для режима `auto`, пауза в секундах между итерациями цикла или включение режима idle-режима (разбудить при завершение таких-то процессов из `process_log`, получение новых сообщений с такими-то пораметрами в `notes` или через такое-то время; для отключения idle-режима достаточно выполнения одного из условий)
 * и другие команды
 ## 5. Проверка на идентичность вывода (Anti-Stagnation Reflex)
-* Если вывод LLM идентичен предыдущему:
-  * Включается **Anti-Stagnation Reflex**
-  * Повторяющиеся реплики не отправляются в `llm_recent_responses` повторно но туда добавляется краткая запись, фиксирующая, запуск **Anti-Stagnation Reflex**.
-* Идентичность может проверяться:
-  * По хешу или текстовому совпадению
-  * Через мини-запрос к LLM (без полного контекста) по шаблону:
-    `Сравни два ответа и оцени, содержатся ли в новом новые мысли или команды`
-  * Второй вариант сравнения является более предпочтительным, так как сравнивается смысл
 ## 6. Генерация нового тика (итерации)

 Структура БД, используемая в документе: [db_structure.sql](https://github.com/kagvi13/HMP/blob/main/agents/tools/db_structure.sql)
+---
 ## 1. Обновление process_log
 * Скрипт REPL проверяет список процессов в БД (`process_log`), определяя, какие команды были выполнены, завершились ошибкой или завершились успешно.
 * Скрипт может удалить закрытые процессы при очистке.
 * LLM не имеет доступа к stdout/stderr напрямую — только к тем результатам, которые были подгружены скриптом и внесены в `process_log.result`.
+---
 ## 2. Подготовка контекста
 Контексты, формируемые скриптом перед запросом к LLM:
   * Это не просто лог предыдущих сообщений, а именно *внутреннее долговременное хранилище* разума агента.
   * Может быть представлено в виде таблицы `llm_memory`, отдельной от `agent_log`.
+---
 ## 3. Запрос к LLM
 * Также включаются инструкции о формате вывода (например, `# Команды:` в конце, структура JSON-блока и т.д.).
 * При необходимости может использоваться системная инструкция (system prompt), содержащая цель агента, ограничения и текущий REPL-режим (manual/auto).
+---
 ## 4. Извлечение команд
 * Скрипт парсит ответ LLM на предмет команд, размеченных как `# Команды:` (или в явном JSON-блоке).
 * для управления *настройками цикла*: количество возвращаемых записей `llm_recent_responses`, режим обработки сообщений пользователя (`manual` или `auto`) и фильтр для режима `auto`, пауза в секундах между итерациями цикла или включение режима idle-режима (разбудить при завершение таких-то процессов из `process_log`, получение новых сообщений с такими-то пораметрами в `notes` или через такое-то время; для отключения idle-режима достаточно выполнения одного из условий)
 * и другие команды
+---
 ## 5. Проверка на идентичность вывода (Anti-Stagnation Reflex)
+* Каждый новый вывод LLM проходит через мини-запрос к LLM (без полного контекста) по шаблону:
+    `Сравни два ответа и оцени, содержатся ли в новом новые мысли или команды.
+     Дай качественную оценку (да/нет), количественную оценку,
+     JSON-список новых идей и JSON-список отбракованных идей.`
+* Результаты заносятся в `llm_recent_responses`:
+  - полный текст ответа (content)
+  - краткая сводка (reflection) — формируется автоматически:
+    - если `new_ideas` не пусто → `новые идеи: ...`
+    - если `discarded_ideas` не пусто → `отброшенные идеи: ...`
+  - количественная оценка новизны (novelty_score)
+  - новые идеи (new_ideas)
+  - отбракованные идеи (discarded_ideas)
+* Если вывод LLM идентичен предыдущему (новизна = 0):
+  - Включается **Anti-Stagnation Reflex**
+  - повторяющаяся реплика не записывается повторно,
+    вместо этого добавляется краткая запись, фиксирующая запуск рефлекса.
+---
 ## 6. Генерация нового тика (итерации)