Skip to content

Latest commit

 

History

History
176 lines (116 loc) · 6.88 KB

README_JA.md

File metadata and controls

176 lines (116 loc) · 6.88 KB

RWKV Runner

このプロジェクトは、すべてを自動化することで、大規模な言語モデルを使用する際の障壁をなくすことを目的としています。必要なのは、 わずか数メガバイトの軽量な実行プログラムだけです。さらに、このプロジェクトは OpenAI API と互換性のあるインターフェイスを提供しており、 すべての ChatGPT クライアントは RWKV クライアントであることを意味します。

license release

English | 简体中文 | 日本語

インストール

Windows MacOS Linux

FAQs | プレビュー | ダウンロード | サーバーデプロイ例

デフォルトの設定はカスタム CUDA カーネルアクセラレーションを有効にしています。互換性の問題が発生する可能性がある場合は、コンフィグページに移動し、Use Custom CUDA kernel to Accelerate をオフにしてください。

Windows Defender がこれをウイルスだと主張する場合は、v1.3.7_win.zip をダウンロードして最新版に自動更新させるか、信頼済みリストに追加してみてください (Windows Security -> Virus & threat protection -> Manage settings -> Exclusions -> Add or remove exclusions -> Add an exclusion -> Folder -> RWKV-Runner)。

異なるタスクについては、API パラメータを調整することで、より良い結果を得ることができます。例えば、翻訳タスクの場合、Temperature を 1 に、Top_P を 0.3 に設定してみてください。

特徴

  • RWKV モデル管理とワンクリック起動
  • OpenAI API と完全に互換性があり、すべての ChatGPT クライアントを RWKV クライアントにします。モデル起動後、 https://127.0.0.1:8000/docs を開いて詳細をご覧ください。
  • 依存関係の自動インストールにより、軽量な実行プログラムのみを必要とします
  • 2G から 32G の VRAM のコンフィグが含まれており、ほとんどのコンピュータで動作します
  • ユーザーフレンドリーなチャットと完成インタラクションインターフェースを搭載
  • 分かりやすく操作しやすいパラメータ設定
  • 内蔵モデル変換ツール
  • ダウンロード管理とリモートモデル検査機能内蔵
  • 内蔵のLoRA微調整機能を搭載しています
  • このプログラムは、OpenAI ChatGPTとGPT Playgroundのクライアントとしても使用できます
  • 多言語ローカライズ
  • テーマ切り替え
  • 自動アップデート

API 同時実行ストレステスト

ab -p body.json -T application/json -c 20 -n 100 -l https://127.0.0.1:8000/chat/completions

body.json:

{
  "messages": [
    {
      "role": "user",
      "content": "Hello"
    }
  ]
}

埋め込み API の例

Note: v1.4.0 has improved the quality of embeddings API. The generated results are not compatible with previous versions. If you are using embeddings API to generate knowledge bases or similar, please regenerate.

LangChain を使用している場合は、OpenAIEmbeddings(openai_api_base="https://127.0.0.1:8000", openai_api_key="sk-") を使用してください

import numpy as np
import requests


def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))


values = [
    "I am a girl",
    "我是个女孩",
    "私は女の子です",
    "广东人爱吃福建人",
    "我是个人类",
    "I am a human",
    "that dog is so cute",
    "私はねこむすめです、にゃん♪",
    "宇宙级特大事件!号外号外!"
]

embeddings = []
for v in values:
    r = requests.post("https://127.0.0.1:8000/embeddings", json={"input": v})
    embedding = r.json()["data"][0]["embedding"]
    embeddings.append(embedding)

compared_embedding = embeddings[0]

embeddings_cos_sim = [cosine_similarity(compared_embedding, e) for e in embeddings]

for i in np.argsort(embeddings_cos_sim)[::-1]:
    print(f"{embeddings_cos_sim[i]:.10f} - {values[i]}")

関連リポジトリ:

プレビュー

ホームページ

image

チャット

image

補完

image

コンフィグ

image

モデル管理

image

ダウンロード管理

image

LoRA Finetune

image

設定

image