マイクロソフトOneDriveで文書をインデックスするのと同様に、Alliは、指定されたHTMLページをドキュメント化し、ナレッジベースに追加することができます 。
まず、ナレッジベース>ソース設定に移動します。 ナレッジベースの可能なソースとして、OneDriveとHTMLドキュメントが表示されます。 [HTMLドキュメント]タブの[追加]ボタンをクリックして開始します。

ポップアップが表示されますので、データをクロールするHTMLドキュメントのURLを入力します。指定したページは、必ずパブリックページでなければならないという点に注意してください。また、ドキュメントの名前を決定する方法を選択することもできます。ドキュメントの名前は、URLを使用するか、HTMLドキュメントのタイトル、または直接名前を指定することができます。

「下位URLの正規表現」フィールドの下にある「下位URLの正規表現」をチェックすると、メインページのリンクのコンテンツにインデックスを付けることができます。 正規表現形式を使用して、データをクロールするためのリンクを指定します。 たとえば、次のように設定することで、「https://example.allganize.ai/」で始まる「https://example.allganize.ai/」にリンクされているすべてのページにインデックスを付けることができます。

もう一つの例として、下位URLの正規表現を「https://example.allganize.ai/product.*」に設定した場合、「https://example.allganize.ai/」ドメインからproductで始まるすべてのページのテキストを取得します。 たとえば、「https://example.allganize.ai/product_alli」あるいは「https://example.allganize.ai/product/alli」などです。
「下位のURLの正規表現」機能を使用する場合、メインURLのコンテンツはクロールされないことに注意してください。
[保存]ボタンをクリックすると、「HTMLドキュメント」セクションに追加したアイテムが表示されます。ドキュメント名を表示するには、そのまま待つか、[今すぐ取り込む]をクリックします。なお、インポートデータが多い場合は時間がかかることがあります。ステータス トグルがオンの場合、UTC午前0時毎に自動更新が行われドキュメントを最新の状態に保ちます。

作成されたドキュメントは、[ドキュメント]タブに保存されます。

アップデート
6/23/2021: HTMLソースのドキュメントにカスタム名を使用できるようになりました。