Skip to content

Quick note: what I spent Saturday on.

Быстрая заметка: хочу поделиться на что я потратил субботу

Published:
5 min read

Quick note: I want to share what I spent Saturday on.

I woke up at 5:30 and could not fall asleep because ideas about agents started flooding my mind.
I first heard about agents around 4 years ago, not just as a concept but as “the future.” I agreed then, but probably did not fully realize it. To be honest, only this week I started understanding how they work, and maybe still not fully.

I spent one hour turning LLM ideas in my head, then went to X and started collecting context.
Soon the feed showed people buying Mac mini machines to run agents with Claude Code for all kinds of tasks.

Then I remembered I had a new 32 GB RAM machine at work. I put Debian on it and wanted to build my own agent.
The logic was: strong models like Opus are paid, subscriptions are expensive, so why not try local models? They are weaker, but maybe good enough if looped into long-term improvement tasks.

I explored open-source models that can run on home hardware via Ollama.
1B and 4B models worked even on a weak MacBook with quantization. Gemma had limitations with tools, so I ended up with Qwen3. It runs okay: not fast, not too slow.

Then I launched it with requirements in Cursor: memory editing, web search, self-code updates, self-restart, git rollback on failures, daily summaries to Telegram, and urgent escalation to me in Telegram when needed.

Everything started, but it is still very slow, and internet availability on that machine is limited.

So I decided to build an AI tamagotchi: give it resources, a brain, internet, and a goal. Let’s see where it goes.

Быстрая заметка: хочу поделиться на что я потратил субботу

Проснувшись случайно в 5:30 я уже не смог уснуть т.к. в голове начали проростать мысли по поводу агентов. Про агентов впервые я услышал ещё года 4 назад. Точнее не просто про них, а что за ними будущее. Я тогда даже согласился, но видимо осознания глубокого не было. Если признаться, я только на этой неделе понял как они работают и то, возможно, не до конца. Да, курсор тоже агент и я это знал, но когда пользуешься готовым продуктом происходит замещение смысла. Как когда говорят “iPhone и Android” имея ввиду iOS, а не iPhone.

Кароче, час я просто не мог заснуть и крутил llm в своей голове, а второй час я пошел в Х и начал собирать свой контекст. Последние пол часа лента начинает мне подсовывать чуваков, которые напокупали себе mac mini, чтобы крутить на нем агентов на cloude code и выполнять свои задачи (не только прогерские).

Я вспоминаю, что у меня на работе пылится новый комп с 32 Gb RAM. Я не хотел им пользоваться по многим причинам. Совершенно случайно во вторник Алексей мне подогнал загрузочную флешку и я накатил на него debian. Я тоже захотел себе своего агента и цепочка мыслей была такая: чтобы решать свои задачи нужна хорошая, мощная модель типа opus-4.5, но она платная и скорее всего для такой vibe life нужно покупать подписку за 100$, что, очевидно, не вариант. Если это не вариант, то почему бы не попробовать запустить локальную модель? Локальная модель будет тупее, потому какие-то супер задачи ей смысла давать нет. А что если зациклить агента с этой моделью и дать ей какую-нибудь глобальную задачу, например, развиваться и масштабироваться (наделить волей к жизни через системный промт). Этот промт по сути фундаментальная ячейка долговременной памяти. Пусть она действительно хранится в папке в обсидиане, к которой у агента будет доступ и права менять структуру своих мыслей и памяти как он захочет.

Далее я погрузился в исследование опенсорс моделей, которые бы завелись на домашнем железе. Вспомнил, что есть gemma3 от google. Вспомнил, что есть ollama, которая позволяет легко загружать эти модели и тестировать их через интерфейс (и даже дает локальный апи). Скачал себе на макбук с 8 RAM модель с 1B параметров и удивился, что это работает. Бомжацкий макбук потянул с усилием и модель на 4B (естественно, с квантованием). Оказалось, что Gemma3 не поддерживает вызов инструментов, есть отдельная FunctionGemma, но как я понял, она глуповатая. В итоге скачал qween3 на 20 gb. Бонусом она еще и думающая. Работает через ollama на компе нормально, не шустро, но и не медленно.

Дальше я закинул в курсор хотелки и запустил. Хотелки: помимо вызовов инструментов для редактирования своей памяти я понял, что в идеале она могла бы делать веб поиск, уметь изменять собственный код и перезапускаться, а в случае ошибки откатываться через git. Хотелось бы, чтобы она раз в день выгружала саммари в телеграмм канал и в случае срочных вопросов писала бы мне в телеграмм за советом/разрешением/просьбой. В итоге, она создала себе список задач, с целью заработать 1000 р на подписку на более мощную модель (этот прикол я задал в системном промте, что смогу ей открыть счет и платить деньги, если она будет выполнять полезную нагрузку).

Кароче, хоть все и завелось, но работает сейчас очень медленно. Интернета на компе без меня нет, потому как он там живёт сейчас никто не знает.

Вот решил собрать такого тамагочи, дать ему ресурсов, мозги, интернет, цель. Посмотрим к чему все это придет. Надеюсь, к серии из Любовь.Смерть.Роботы про Зимму Блю.

View on Telegram