RWKV Runner

このプロジェクトは、すべてを自動化することで、大規模な言語モデルを使用する際の障壁をなくすことを目的としています。必要なのは、わずか数メガバイトの軽量な実行プログラムだけです。さらに、このプロジェクトは OpenAI API と互換性のあるインターフェイスを提供しており、すべての ChatGPT クライアントは RWKV クライアントであることを意味します。

English | 简体中文 | 日本語

インストール

FAQs | プレビュー | ダウンロード | サーバーデプロイ例

デフォルトの設定はカスタム CUDA カーネルアクセラレーションを有効にしています。互換性の問題が発生する可能性がある場合は、コンフィグページに移動し、`Use Custom CUDA kernel to Accelerate` をオフにしてください。

Windows Defender がこれをウイルスだと主張する場合は、v1.3.7_win.zip をダウンロードして最新版に自動更新させるか、信頼済みリストに追加してみてください (`Windows Security` -> `Virus & threat protection` -> `Manage settings` -> `Exclusions` -> `Add or remove exclusions` -> `Add an exclusion` -> `Folder` -> `RWKV-Runner`)。

異なるタスクについては、API パラメータを調整することで、より良い結果を得ることができます。例えば、翻訳タスクの場合、Temperature を 1 に、Top_P を 0.3 に設定してみてください。

特徴

RWKV モデル管理とワンクリック起動
OpenAI API と完全に互換性があり、すべての ChatGPT クライアントを RWKV クライアントにします。モデル起動後、 https://127.0.0.1:8000/docs を開いて詳細をご覧ください。
依存関係の自動インストールにより、軽量な実行プログラムのみを必要とします
2G から 32G の VRAM のコンフィグが含まれており、ほとんどのコンピュータで動作します
ユーザーフレンドリーなチャットと完成インタラクションインターフェースを搭載
分かりやすく操作しやすいパラメータ設定
内蔵モデル変換ツール
ダウンロード管理とリモートモデル検査機能内蔵
内蔵のLoRA微調整機能を搭載しています
このプログラムは、OpenAI ChatGPTとGPT Playgroundのクライアントとしても使用できます
多言語ローカライズ
テーマ切り替え
自動アップデート

API 同時実行ストレステスト

ab -p body.json -T application/json -c 20 -n 100 -l https://127.0.0.1:8000/chat/completions

body.json:

{
  "messages": [
    {
      "role": "user",
      "content": "Hello"
    }
  ]
}

埋め込み API の例

Note: v1.4.0 has improved the quality of embeddings API. The generated results are not compatible with previous versions. If you are using embeddings API to generate knowledge bases or similar, please regenerate.

LangChain を使用している場合は、OpenAIEmbeddings(openai_api_base="https://127.0.0.1:8000", openai_api_key="sk-") を使用してください

import numpy as np
import requests


def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))


values = [
    "I am a girl",
    "我是个女孩",
    "私は女の子です",
    "广东人爱吃福建人",
    "我是个人类",
    "I am a human",
    "that dog is so cute",
    "私はねこむすめです、にゃん♪",
    "宇宙级特大事件！号外号外！"
]

embeddings = []
for v in values:
    r = requests.post("https://127.0.0.1:8000/embeddings", json={"input": v})
    embedding = r.json()["data"][0]["embedding"]
    embeddings.append(embedding)

compared_embedding = embeddings[0]

embeddings_cos_sim = [cosine_similarity(compared_embedding, e) for e in embeddings]

for i in np.argsort(embeddings_cos_sim)[::-1]:
    print(f"{embeddings_cos_sim[i]:.10f} - {values[i]}")

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_JA.md

README_JA.md

RWKV Runner

インストール

デフォルトの設定はカスタム CUDA カーネルアクセラレーションを有効にしています。互換性の問題が発生する可能性がある場合は、コンフィグページに移動し、`Use Custom CUDA kernel to Accelerate` をオフにしてください。

異なるタスクについては、API パラメータを調整することで、より良い結果を得ることができます。例えば、翻訳タスクの場合、Temperature を 1 に、Top_P を 0.3 に設定してみてください。

特徴

API 同時実行ストレステスト

埋め込み API の例

関連リポジトリ:

プレビュー

ホームページ

チャット

補完

コンフィグ

モデル管理

ダウンロード管理

LoRA Finetune

設定

Files

README_JA.md

Latest commit

History

README_JA.md

File metadata and controls

RWKV Runner

インストール

デフォルトの設定はカスタム CUDA カーネルアクセラレーションを有効にしています。互換性の問題が発生する可能性がある場合は、コンフィグページに移動し、Use Custom CUDA kernel to Accelerate をオフにしてください。

異なるタスクについては、API パラメータを調整することで、より良い結果を得ることができます。例えば、翻訳タスクの場合、Temperature を 1 に、Top_P を 0.3 に設定してみてください。

特徴

API 同時実行ストレステスト

埋め込み API の例

関連リポジトリ:

プレビュー

ホームページ

チャット

補完

コンフィグ

モデル管理

ダウンロード管理

LoRA Finetune

設定

デフォルトの設定はカスタム CUDA カーネルアクセラレーションを有効にしています。互換性の問題が発生する可能性がある場合は、コンフィグページに移動し、`Use Custom CUDA kernel to Accelerate` をオフにしてください。