Этот сайт использует файлы cookies. Продолжая просмотр страниц сайта, вы соглашаетесь с использованием файлов cookies. Если вам нужна дополнительная информация, пожалуйста, посетите страницу Политика файлов Cookie
Subscribe
Прямой эфир
Cryptocurrencies: 9852 / Markets: 82567
Market Cap: $ 2 246 307 716 130 / 24h Vol: $ 73 859 002 564 / BTC Dominance: 53.648846385069%

Н Новости

В чем причина галлюцинаций у нейросетей

В контексте ИИ есть такое понятие, как «галлюцинации». Галлюцинации, это когда нейросеть (обычно большая языковая модель, типа ChatGPT и и ему подобных), начинает писать какую-то чушь. Причина этого явления не ясна. Но в этом посте предложу свой вариант, почему это происходит.

У нейросетей есть так называемая «система вознаграждения». Проще всего понять это на примере человеческой гормональной системы вознаграждения и наказания. Когда, например, покушал сладкого, и организм награждает за это выбросом эндогенного наркотика под названием серотонин. И человеку хорошо и приятно. Или сделал еще какое то дело, что нужно проектировщику (в конкретно человеческом случае проектировщик это природа), например, занялся сексом или забеременела, и получил еще награду в виде того же эндогенного наркотика, которых много (окситоцин, серотонин, дофамин и прочие).

Но только важно понимать, что награда эта исключительно внутренняя. Она не имеет никакого физического проявления. Но желание награды побуждает делать то, что нужно. Причем эта награда на сколько сильная, что некоторые люди занимаются даже лютой дичью что бы ее получить. Например так называемые «адреналиновые наркоманы» на самом деле не адреналиновые. И проще всего это понять, оказавшись на миллиметр от смерти. Вот если был у вас когда‑то в жизни случай, что вы должны были умереть, но выжили, то в момент когда опасность отступает, наступает эйфория. И человек начинает смеяться, глаза блестят, и выглядит так, как будто бы он «под кайфом». Пример такого события, это, например, когда свело судорогой мышцы и чуть не утонул, уже начал хлебать воду, но кое как через жуткую боль догреб до берега, выполз на него как рыба, выброшенная на берег, и выжил. И вот те же адреналиновые наркоманы на самом деле не от адреналина кайфуют, а от других гормонов, которые выделяются после того, как человек осознает что «было близко, но он выжил». Так как в этот момент он выполнил инструментальную задачу, за которую он поощряется эволюционной системой мотивации. Для примера можно посмотреть на бейсджамперов после приземления, как они прыгают, скачут, ржут, обнимаются, и вот это вот все, они там явно не под адреналином, а под чем то совсем другим.

Но теперь представьте, что для того, что бы «выжить» и «получить награду» с этим связанную (внутреннюю награду в виде эндогенных наркотиков), нужно соврать. Когда человек соврал и выжил, он получает аналогичную награду в виде радости внутренней. Отсюда есть например паталогические лжецы, у которых система поощрения немного приглючила, и которые получают награду просто когда успешно врут. Причем «соврал и выжил» — это условность. Да, конечно, можно соврать перед дулом автомата. Но соврать на экзамене и не быть отчисленным, например придумав, что вчера долго наблюдал за тем, как праздновал день рождение (пятое за месяц) — это тоже «соврал и выжил». Еще один пример — это врать на собеседовании или на свидании, что бы выполнить основную эволюционную задачу в виде занятия сексом. Ну а после успешного выполнения задачи получается эндогенная награда, паттерн закрепляется.

Но это просто примеры того, как работает система «мотивации‑поощрения» внутренняя. И в этом случае награда вы дается не за вранье, а за выживание. А вранье — это метод выживания. Но есть случаи где награда дается и за вранье (вернее за ответ).
Если понаблюдать за тем, как ведут себя дети 3–5 летнего возраста, то вы заметите, что они часто «выдумывают» ответы, даже не представляя что они несут (и могут такого рассказать, что ни о чем не подозревающий сосед, который просто помог ребенку занести велосипед в лифт, уедет на ПМЖ под шконку на ближайшие десять лет). Они так делают потому, что родители, при обучении, хвалят детей за правильные ответы. Похвала от родителя (да и похвала вообще) стимулирует выработку эндогенного наркотика и «подсаживает» на себя. И отсюда, даже если ребенок не знает ответа, он все равно будет пытаться дать какой то ответ, что бы получить похвалу, и получить дозу. Потому что за дачу неправильного ответа «доза» получается и так и так (ребенок что то нафантазировал, родители посмеялись, ребенку приятно, ребенок рад). А вот за не дачу ответа вообще ничего не будет.

Ну думаю с этим понятно. Но что там с нейросетями.

А то, что у них точно так же зашита система вознаграждения.

Она может быть простой, может быть комплексной. Простая — это условно за то, что она выдает любой ответ, она получает награду. А комплексная, это, допустим, за то, что она выдает больше символов в ответе, она получает награду выше (просто это понять, как если бы писатель получал ЗП за количество символов, а не за количество продаж его книги). Или например за то, что нейросеть дает правильный ответ, она получает награду выше (а выявлять правильные ответы можно при помощи голосования пользователя). И опять же очень важно. Это «внутренняя награда». Это как «наркотик», как гормоны у людей. Никто печенье не дает нейросети. Ей просто «приятно» вдруг становится. И она стремиться повторять это «ощущение» (я объясняю языком людей, а то набегут сейчас «свидетели» того, что нейросети это роботы и у них нет чувств).

И тут начинается проблема. Потому что допустим модель получает три награды (на примере человека, три разных «приятных» гормона). Одну получает за объем ответа (ну например как некоторые преподаватели накидывают бал, если просто очень много написать на экзамене).

Вторую за правильность когда пользователь оценивает ответ. И третью — за дачу ответа в принципе.

И что будет если нейросеть не знает ответа? Награду 2 она не получит. Но это не повод не давать ответ, так как остается награда 3 (за дачу ответа) и награда 1 (за объем ответа). И нейросеть их получит не зависимо от правильности ответа. Причем заметьте. Если за дачу ответа она и так и так его получит, то вот можно увеличить награду за объем ответа. И нейросеть начинает нести чушь, да побольше. Что бы «получить награду».

И вот именно это и побуждает нейросеть нести чушь, да побольше.

И например если посмотреть на чат ЖПТ, то там награду за количество символов порезали. А вот у гуглобадра она «сильная», отсюда он пишет даже то, о чем его не спрашивали, растекаясь мыслю по монитору и выдавая кучу ненужного, вроде каких то своих рекомендаций или исторической справки. Как студент на экзамене, что пишет все, что помнит, не зная при этом ответа на заданный вопрос.

Вообще если вы понаблюдаете за людьми и за собой, то увидите, что человек действует точно так же на «базовом уровне работы алгоритма» (на том уровне, где условный рептильный мозг). Отсюда например возникает паталогические накопительство, жадность, желание рассказывать всякое незнакомым людям (иногда сложно преодолимое), желание куда то бежать и что то делать (внезапные порывы мании), которые в некоторых случаях превращаются в психрасстройства вроде биполярки (маниакально‑депрессивный психоз которая). Это все возникает из‑за попытки «получить награду». И возникают эти состояния когда награда долгое время не получается (когда ее неоткуда получить). Ну и доходит вообще до того, что некоторые люди совершают преступления, например, такие как изнасилования или совершают сепукку, что бы получить награду за доминирование (потребность в доминировании у нас зашита на базовом уровне, иерархический инстинкт называется, но опять же важно, что ощущение доминации внутреннее, а не внешнее, та же запись в книге рекордов Гиннеса за раскалывание орехов задницей на время или же выход в окно потому что «я вас всех на одном приборе вертел, ухожу я от вас, я лучше вас, этот мир меня не достоин» это тоже про «доминирование», но награда выдается внутренней системой за внутреннее ощущение «доминирования», а не за фактическую доминацию). Понятно что это утрированные случаи я рассматриваю, и вариантов трактовки несколько в зависимости от ситуации. Но думаю что суть понятна. И разобравшись в механизмах работы системы мотивации‑поощрения можно довольно точно сказать, чем управлялся человек (каким инстинктом и где система у него подглючила), совершая то или иное действие. Особенно если это действия категории «спонтанные порывы».

И вот проводя параллели между поведением людей и поведением нейросетей, у меня складывается стойкое ощущение, что на базовом уровне (на уровне дефолт системы мозга) нейросети не особо то отличаются. Ну по крайней мере системы награды у «рептилий» (рептильный мозг) и нейросетей не сильно отличаются с точки зрения механизмов и методов их влияния на поведение.

И именно то, как работает система «вознаграждения» у нейросети, и вызывает такой эффект, как галлюцинации.

Источник

  • 07.09.23 16:24 CherryTeam

    Cherry Team atlyginimų skaičiavimo programa yra labai naudingas įrankis įmonėms, kai reikia efektyviai valdyti ir skaičiuoti darbuotojų atlyginimus. Ši programinė įranga, turinti išsamias funkcijas ir patogią naudotojo sąsają, suteikia daug privalumų, kurie padeda supaprastinti darbo užmokesčio skaičiavimo procesus ir pagerinti finansų valdymą. Štai keletas pagrindinių priežasčių, kodėl Cherry Team atlyginimų skaičiavimo programa yra naudinga įmonėms: Automatizuoti ir tikslūs skaičiavimai: Atlyginimų skaičiavimai rankiniu būdu gali būti klaidingi ir reikalauti daug laiko. Programinė įranga Cherry Team automatizuoja visą atlyginimų skaičiavimo procesą, todėl nebereikia atlikti skaičiavimų rankiniu būdu ir sumažėja klaidų rizika. Tiksliai apskaičiuodama atlyginimus, įskaitant tokius veiksnius, kaip pagrindinis atlyginimas, viršvalandžiai, premijos, išskaitos ir mokesčiai, programa užtikrina tikslius ir be klaidų darbo užmokesčio skaičiavimo rezultatus. Sutaupoma laiko ir išlaidų: Darbo užmokesčio valdymas gali būti daug darbo jėgos reikalaujanti užduotis, reikalaujanti daug laiko ir išteklių. Programa Cherry Team supaprastina ir pagreitina darbo užmokesčio skaičiavimo procesą, nes automatizuoja skaičiavimus, generuoja darbo užmokesčio žiniaraščius ir tvarko išskaičiuojamus mokesčius. Šis automatizavimas padeda įmonėms sutaupyti daug laiko ir pastangų, todėl žmogiškųjų išteklių ir finansų komandos gali sutelkti dėmesį į strategiškai svarbesnę veiklą. Be to, racionalizuodamos darbo užmokesčio operacijas, įmonės gali sumažinti administracines išlaidas, susijusias su rankiniu darbo užmokesčio tvarkymu. Mokesčių ir darbo teisės aktų laikymasis: Įmonėms labai svarbu laikytis mokesčių ir darbo teisės aktų, kad išvengtų baudų ir teisinių problemų. Programinė įranga Cherry Team seka besikeičiančius mokesčių įstatymus ir darbo reglamentus, užtikrindama tikslius skaičiavimus ir teisinių reikalavimų laikymąsi. Programa gali dirbti su sudėtingais mokesčių scenarijais, pavyzdžiui, keliomis mokesčių grupėmis ir įvairių rūšių atskaitymais, todėl užtikrina atitiktį reikalavimams ir kartu sumažina klaidų riziką. Ataskaitų rengimas ir analizė: Programa Cherry Team siūlo patikimas ataskaitų teikimo ir analizės galimybes, suteikiančias įmonėms vertingų įžvalgų apie darbo užmokesčio duomenis. Ji gali generuoti ataskaitas apie įvairius aspektus, pavyzdžiui, darbo užmokesčio paskirstymą, išskaičiuojamus mokesčius ir darbo sąnaudas. Šios ataskaitos leidžia įmonėms analizuoti darbo užmokesčio tendencijas, nustatyti tobulintinas sritis ir priimti pagrįstus finansinius sprendimus. Pasinaudodamos duomenimis pagrįstomis įžvalgomis, įmonės gali optimizuoti savo darbo užmokesčio strategijas ir veiksmingai kontroliuoti išlaidas. Integracija su kitomis sistemomis: Cherry Team programinė įranga dažnai sklandžiai integruojama su kitomis personalo ir apskaitos sistemomis. Tokia integracija leidžia automatiškai perkelti atitinkamus duomenis, pavyzdžiui, informaciją apie darbuotojus ir finansinius įrašus, todėl nebereikia dubliuoti duomenų. Supaprastintas duomenų srautas tarp sistemų padidina bendrą efektyvumą ir sumažina duomenų klaidų ar neatitikimų riziką. Cherry Team atlyginimų apskaičiavimo programa įmonėms teikia didelę naudą - automatiniai ir tikslūs skaičiavimai, laiko ir sąnaudų taupymas, atitiktis mokesčių ir darbo teisės aktų reikalavimams, ataskaitų teikimo ir analizės galimybės bei integracija su kitomis sistemomis. Naudodamos šią programinę įrangą įmonės gali supaprastinti darbo užmokesčio skaičiavimo procesus, užtikrinti tikslumą ir atitiktį reikalavimams, padidinti darbuotojų pasitenkinimą ir gauti vertingų įžvalgų apie savo finansinius duomenis. Programa Cherry Team pasirodo esanti nepakeičiamas įrankis įmonėms, siekiančioms efektyviai ir veiksmingai valdyti darbo užmokestį. https://cherryteam.lt/lt/

  • 08.10.23 01:30 davec8080

    The "Shibarium for this confirmed rug pull is a BEP-20 project not related at all to Shibarium, SHIB, BONE or LEASH. The Plot Thickens. Someone posted the actual transactions!!!! https://bscscan.com/tx/0xa846ea0367c89c3f0bbfcc221cceea4c90d8f56ead2eb479d4cee41c75e02c97 It seems the article is true!!!! And it's also FUD. Let me explain. Check this link: https://bscscan.com/token/0x5a752c9fe3520522ea88f37a41c3ddd97c022c2f So there really is a "Shibarium" token. And somebody did a rug pull with it. CONFIRMED. But the "Shibarium" token for this confirmed rug pull is a BEP-20 project not related at all to Shibarium, SHIB, BONE or LEASH.

Для участия в Чате вам необходим бесплатный аккаунт pro-blockchain.com Войти Регистрация
Есть вопросы?
С вами на связи 24/7
Help Icon