Serge Vakulenko (
vak
) wrote
2024
-
11
-
23
10:53 pm
Entry tags:
искусственный интеллект
Как работает LLM
Хотите разобраться, как устроена большая языковая модель? Вот качественная объяснялка.
bbycroft.net/llm
Threaded
|
Flat
no subject
juan_gandhi
2024-11-24 09:23 am (UTC)
(
link
)
Визуализация красивая, но голову морочат. Откуда все эти матрицы взялись при обучении? Как трансформеры работают?
(no subject)
vak
-
2024-11-26 09:27 (UTC)
-
Expand
no subject
juan_gandhi
2024-11-26 12:45 pm (UTC)
(
link
)
Бля, похоже скорее на гадание. Математики там чуток.
Мой-то вопрос был - откуда берутся те матрицы, с которыми происходит свёртка в самом начале.
Ну понятно, что от обучения, но как? И откуда конкретно мы знаем заранее размерность?
(no subject)
vak
-
2024-12-08 22:07 (UTC)
-
Expand
(no subject)
juan_gandhi
-
2024-12-08 23:56 (UTC)
-
Expand
5 comments
Post a new comment
Threaded
|
Flat
[
Home
|
Post Entry
|
Log in
|
Search
|
Browse Options
|
Site Map
]
Otomatik - 54.89.70.73
CloudFlare DNS
Türk Telekom DNS
Google DNS
Open DNS
OSZAR »
no subject
(no subject)
no subject
Мой-то вопрос был - откуда берутся те матрицы, с которыми происходит свёртка в самом начале.
Ну понятно, что от обучения, но как? И откуда конкретно мы знаем заранее размерность?
(no subject)
(no subject)