vak: (Знайка)
[personal profile] vak
Хотите разобраться, как устроена большая языковая модель? Вот качественная объяснялка.

bbycroft.net/llm

Date: 2024-11-24 09:23 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
Визуализация красивая, но голову морочат. Откуда все эти матрицы взялись при обучении? Как трансформеры работают?

Date: 2024-11-26 12:45 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
Бля, похоже скорее на гадание. Математики там чуток.

Мой-то вопрос был - откуда берутся те матрицы, с которыми происходит свёртка в самом начале.
Ну понятно, что от обучения, но как? И откуда конкретно мы знаем заранее размерность?

Date: 2024-12-08 23:56 (UTC)
juan_gandhi: (Default)
From: [personal profile] juan_gandhi
Ага, они при обучении строятся. Ну понятно. Баловался с этим лет пять назад.
OSZAR »