スマホでヴォイスチャットをする女性

フランス語を読む練習

LLM(大規模言語モデル)入門:3分で仕組みをつかむ

今回はLLMについて3分で説明している動画を紹介します。

タイトルは、Les LLM Expliqués (SIMPLEMENT) en 3min(3分で簡単に説明するLLM)

LLMは簡単に言うと、大量の文章を学習し、人の話し方のパターンを覚えたAIです。

Les LLM Expliqués (SIMPLEMENT) en 3min

この動画は、ブログに埋め込めないので、YouTube上で見てください。

Les LLM Expliqués (SIMPLEMENT) en 3min

動画では、LLMの3つのフェーズが説明されています。その図解をLLMで作ってみました。

LLMの3つのフェーズ

トランスクリプション

Tout le monde parle des LLM. Mais qu’est-ce que c’est vraiment ?

Dans cette vidéo, je vous explique tout en moins de 3 minutes pour que vous compreniez exactement comment ça marche et pourquoi c’est une révolution. Accrochez-vous, c’est parti.

LLM, ça veut dire Large Langage Model ou, en français, modèle de langage à grande échelle. Ça fait M, L, G. Donc, on va garder LLM.

Concrètement, un LLM, c’est une IA qui a englouti des tonnes de textes sur Internet pour apprendre à comprendre et générer du texte elle-même.

Un peu comme un perroquet qui répète des choses sans vraiment comprendre ce qui est dit.

Donc, quand vous tapez une question dans ChatGPT, ChatGPT ne réfléchit pas comme un humain. Il analyse des milliards de textes et prédit le mot d’après et la réponse la plus probable.

Quand vous utilisez ChatGPT, d’ailleurs, vous utilisez en réalité un LLM. Le LLM qui s’appelle o3 qui est développé par l’entreprise OpenAI.

Des LLM, il y en a plein.

Google a son propre LLM qui s’appelle Gemini.

Anthropique a le sien qui s’appelle Cloude.

Mistral AI, une entreprise française qui développe son LLM qui s’appelle Mistral.

Tout le monde essaye de créer le meilleur LLM sur le marché.

Alors, c’est cool de parler de LLM, mais comment ça fonctionne ?

Eh bien, ça fonctionne en trois phases.

Le premier, c’est l’apprentissage.

Un LLM est entraîné sur d’énormes bases de données textuelles comme Wikipédia, des livres, des forums, des articles scientifiques. Il absorbe toutes ces données et comprend la structure du langage humain.

Le deuxième, l’identification des schémas.

Contrairement à un moteur de recherche qui va juste retrouver du texte existant, un LLM, lui, va analyser les relations entre les mots et les concepts.

Donc, quand vous allez lui demander quelle est la capitale de la France, il sait que c’est Paris, parce que souvent, Paris est associé aux mots que vous avez tapés avant.

Et la troisième, c’est la prédiction.

Un LLM ne réfléchit pas, il prédit. Il devine le mot d’après avec la probabilité la plus élevée suivant le contexte. Un peu comme un perroquet stéroïdé ultra-puissant.

Des LLM, il y en a deux types qui existent.

Il y a les modèles propriétaires, des modèles fermés comme GPT-4.0, Cloude ou encore Gemini.

Et de l’autre côté, il y a des modèles open source, comme Lama 3, deepseek ou encore Qwen 2.5 qui est fait par l’entreprise Alibaba.

Les modèles propriétaires sont fermés, détenus par des entreprises et entraînés de manière assez secrète, alors que les modèles open source peuvent, eux, être téléchargés, modifiés, utilisés gratuitement, même hors ligne.

Mais attention, vu que les LLM ne font juste imiter les humains, ils n’ont aucune idée de ce qui est vrai ou faux.

Le premier problème, c’est l’hallucination.

Un LLM peut inventer des réponses et les dire avec confiance, tout simplement parce qu’il pense que c’est le prochain mot qui devrait arriver après votre question.

Il peut affirmer, par exemple, qu’un prédisant fictif a existé, alors que pas du tout.

Attention aussi aux biais et aux manipulations.

Si un modèle a été entraîné sur des données qui sont elles-mêmes biaisées, il peut juste répéter ses biais.

Les IA propriétaires peuvent aussi être censurées ou orientées par les entreprises qui les contrôlent.

Par exemple, essayer sur deepseek, le LLM chinois, de lui poser des questions sur le régime politique en Chine, par exemple. Vous allez voir, c’est assez amusant.

Et l’autre sujet avec l’LLM, c’est les problèmes de confidentialité. Tout ce que vous tapez dans ChatGPT ou Gemini, qui sont des modèles propriétaires, peut être enregistré et analysé.

D’où l’intérêt d’un LLM open source, que vous allez pouvoir héberger vous-même. J’ai d’ailleurs fait une vidéo quelques jours en vous expliquant comment le faire.

En résumé, les LLM, c’est juste des machines à prédire du texte, mais leur impact est énorme.

Ça va remplacer des métiers, créer des nouveaux usages et changer notre façon de bosser avec les machines.

C’est la fin de ce nouveau format. J’espère que ces 3 minutes vous ont plu.

En tout cas, sachez que toutes les vidéos qui étaient là, dans cette vidéo, pour illustrer, étaient elles-mêmes générées par un LLM spécialisé dans la génération de vidéos.

Et maintenant, la vidéo qui s’affiche ici est la vidéo que suggère le LLM de Google, qui pense que vous devriez regarder ça en fonction de votre historique de visionnage sur YouTube.

Allez, on se retrouve ici.

和訳:LLMとは?

みんながLLMについて話しています。でも、それは実のところ何なのでしょうか?

この動画では、LLMがどう機能するのか、なぜそれが革命なのかを正確に理解できるよう、3分以内ですべて説明します。しっかりついてきてください。では始めましょう。

LLMとは、Large Language Modelの略で、フランス語では「modèle de langage à grande échelle(大規模言語モデル)」と言います。これだとM、L、Gになってしまうので、LLMのままにしておきましょう。

具体的に言うと、LLMは、インターネット上の大量のテキストを飲み込んで、自分自身でテキストを理解し生成することを学んだAIです。

言われていることを本当には理解せずにそのまま繰り返すオウムのようなものです。

だからChatGPTに質問を入力したとき、ChatGPTは人間のように考えているわけではありません。何十億ものテキストを分析して、次の単語と最も可能性の高い回答を予測しています。

ところで、ChatGPTを使うとき、実際にはLLMを使っているわけです。o3という名前のLLMで、OpenAIという企業によって開発されています。

LLMはたくさんあります。

Googleには、Geminiという独自のLLMがあります。

Anthropicには、Claudeという自社のLLMがあります。

Mistral AIは、Mistralという名前のLLMを開発しているフランスの企業です。

みんなが市場で最高のLLMを作ろうとしているのです。

さて、LLMについて話すのはいいのですが、どう機能するのでしょうか?

LLMは3つのフェーズで動きます。

1つ目は、学習です。

LLMは、ウィキペディア、本、フォーラム、科学論文などの膨大なテキストデータベースで訓練されます。これらすべてのデータを吸収して、人間の言語の構造をつかみます。

2つ目は、パターンの識別です。

既存のテキストを見つけるだけの検索エンジンとは違い、LLMは単語と概念の関係を分析します。

だからフランスの首都は何かと尋ねると、パリだとわかります。なぜなら、パリはあなたが前にタイプした単語とよく一緒に出てくるからです。

3つ目は、予測です。

LLMは考えません。予測します。文脈に応じて、最も高い確率で次の単語を推測します。ステロイドを打たれた超強力なオウムのようなものです。

LLMには、2つのタイプが存在します。

GPT-4.0、Claude、Geminiのような、クローズドモデルである独自モデルがあります。

もう一方は、Llama 3、deepseek、あるいはAlibaba社が作ったQwen 2.5のようなオープンソースモデルです。

独自モデルは閉じられていて、企業が所有し、かなり秘密裏に訓練されています。一方、オープンソースモデルは、ダウンロードや改変をしたりして、無料で使え、オフラインでも使えます。

ただし注意が必要です。LLMは人間を真似しているだけなので、何が真実で何が偽りかは全く理解していません。

最初の問題は、ハルシネーション(幻覚)です。

LLMは、答えを作り出して自信を持って言うことがあります。単にそれが、あなたの質問の後に来るべき次の単語だと思っているからです。

たとえば、架空の大統領が、「存在した」と断言することがありますが、そんな事実はありません。

バイアスと操作にも注意が必要です。

モデル自体が偏ったデータで訓練されていれば、そのバイアスを繰り返すことがあります。

独自のAIは、それを管理する企業によって検閲されたり、方向づけられたりすることもあります。

たとえば、中国のLLMであるdeepseekで、中国の政治体制について質問してみてください。かなり面白いですよ。

LLMに関するもう1つの問題は、プライバシーです。ChatGPTやGeminiなどの独自モデルに入力したものはすべて、記録され分析される可能性があります。

だから、自分の環境で運用できるオープンソースのLLMが重要です。数日前に、その方法を説明する動画を作りました。

まとめると、LLMはテキストを予測する機械にすぎませんが、その影響は非常に大きいです。

職業が置き換えられ、新しい使い方が生まれ、機械との仕事のやり方を変えていくでしょう。

新しいフォーマットの動画はこれで終わりです。この3分間を楽しんでいただけたら幸いです。

いずれにせよ、この動画の中で説明のために使われていた動画はすべて、動画生成に特化したLLMによって生成されたものです。

そして今、ここに表示されている動画は、GoogleのLLMが、みなさんのYouTubeでの視聴履歴に基づいて、みなさんが見るべきだと考えて提案している動画です。

それでは、またここでお会いしましょう。

単語メモ

à grande échelle 大規模な

engloutir 飲み込む、吸収する

prédire 予測する

entraîner sur 〜で訓練する

schéma パターン、図式

moteur de recherche 検索エンジン

élevé 高い

propriétaire 企業所有の、クローズドの

vu que 〜なので、〜を考慮すると

héberger ホストする、受け入れる、自前で動かす

D’où l’intérêt de 〜 だからこそ〜が重要なのだ

en fonction de 〜に応じて、〜に基づいて

プチ文法:前置詞代名詞 en

en は代名詞で、de で始まる名詞句(de + 名詞)を受けます。

数量表現(beaucoup, plein, trois…)の中身や、部分冠詞(du/de la/des)がついた名詞(= =その一部/それ」も受けます。

※数量表現(plein / beaucoup など)の後ろは、複数でも de を使います。

動画の中で出てきた文:Des LLM, il y en a plein.(LLMは、たくさんあります)。

元の文を考えると:
Il y a plein de LLM. (LLMがたくさんある)

これを強調するために、Des LLMを文頭に出し、de LLMの部分をenで受けています。

il y en(= de LLM)a plein.

ほかの例:

Des pommes ? J’en ai trois. りんご? 私は3つ持っています。(en = des pommes)

Tu veux du café ? Oui, j’en veux. コーヒーが欲しい? うん、欲しい。(en = du café)

Elle parle de son voyage. Elle en parle souvent. 彼女は旅行の話をします。彼女はその話をよくします。 (en = de son voyage)

参考記事⇒「まいにちフランス語」29:L51 中性代名詞 en と y

■ en のわかりやすい説明をしている動画

LLM関連動画

L’intelligence artificielle (IA) expliquée aux enfants(AIの子ども向けの説明)

4分47秒

◆内容のまとめ:

AI(人工知能)とは

AI(フランス語ではIA)は、コンピュータやロボットが人間のように考え、学習し、判断できるようにするための技術のことです。

身近なAIの活用例

AIはすでに私たちの生活の至る所にあります。YouTubeのおすすめ動画の表示、ビデオゲームのキャラクターの操作、GPSのルート案内などがその一例です。

学習の仕組み

AIは人間がサッカーや読書を練習するのと同じように、トレーニングによって学習します。大量の画像やデータを与えると、パターンを認識し、判断できるようになります。

AIができること(創造と実用)

AIの能力は多岐にわたり、物語を書く、絵を描く、作曲する、架空の映像を作るなどできます。また、自動運転や個人のレベルに合わせた学習ドリルの作成なども行えます。

先生の代わりにはなれない

AIは強力なツールですが、教師に取って代わることはできません。AIは情報を提供するだけですが、教師は生徒の感情を理解し、やる気を引き出すことができるからです。

注意すること

AIは完璧ではありません。学習したデータが不正確だと、間違ったり偏った判断(バイアス)をしたりすることがあります。そのため、AIの情報を鵜呑みにせず、人間が確認することが重要です。

あくまでツール

AIは人間の知能を置き換えるものではなく、問題を解決し生活を便利にするためのツールです。私たち人間がどうやって正しく使うかを考えなければなりません。

*****

2つ目の動画では、AIは先生の代わりにはなれないと言っていますが、「やる気が出る言葉をかけて」と言うと、それらしい声かけをしてくれるので、使い方によっては、先生の代わりになるかもしれません。

金八先生のように生き様を見せることはできませんが。

教材を作ることに関しては、NotebookLMなどが、さまざまな形で作ってくれます。YouTubeやNetflixもありますし、もはや参考書やオーディオ教材を買う必要はないかもしれませんね。






古っぽいフレンチリビエラブリジット・バルドー死去:代表作5本とヤギとの出会い前のページ

ピックアップ記事

  1. 『星の王子さま』~お役立ちリンク集

  2. 2023年版、フランス語学習用カレンダーの紹介:テーマは「食」

関連記事

  1. モリエールの像

    フランス語を読む練習

    モリエールの作品が古くならない理由。

    今年2022年はモリエール(1622-1673)の生誕400周年。その…

  2. 日本画

    フランス語を読む練習

    フランスの子ども向けのサイトで日本に関する話を読んでみた

    以前フランス語の子どもむけのお話が読めるサイト(音声つき)で紹介したフ…

  3. ノルマンディー

    フランス語を読む練習

    なぜノルマンディー上陸作戦は伝説となったのか?(4・終)

    ノルマンディー上陸作戦が、欧米で必要以上に称賛されているのではないか、…

  4. 駅にいる猫

    フランス語を読む練習

    パリのRERの駅にいる名物猫、タガ。

    パリのパークドサンモール駅にいる名物猫が話題の2分のニュースクリップを…

  5. アルゴリズム

    フランス語を読む練習

    アルゴリズムってなに?:9世紀に生まれた言葉の正体

    アルゴリズムの起源と発展を説明している1分半の動画を紹介します。…

  6. 病院の天井

    フランス語を読む練習

    安楽死の合法化の現状。

    安楽死について1分40秒で簡単に説明しているインフォグラフィック動画を…

コメント

  • コメント (0)

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

更新情報をメールで配信中

メールアドレスを記入して購読すれば、更新をメールで受信できます。

お問い合わせはこちらから

お問い合わせはこちらからどうぞ

封筒
⇒お問い合わせフォームへ


お気軽に^^

☆和文仏訳、仏文和訳の無償サービスは行っておりませんので、ご了承願います。

アーカイブ
PAGE TOP