V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
a302800411
V2EX  ›  分享创造

[纯浏览器 ] 中文短文本向量聚类(bge+dbscan)

  •  2
     
  •   a302800411 · 6 天前 · 874 次点击

    在线使用

    访问链接:https://text2-vector-cluster-web-zh.vercel.app/

    部署在 vercel ,需要保证你的网络环境可以访问

    功能概述

    依托于 transformers.js 项目

    • 纯浏览器运行:所有计算均在浏览器内完成,无需服务器支持。
    • 向量计算:采用 BGE 算法进行高效的向量计算。
    • 聚类分析:使用 DBSCAN 算法进行数据聚类。
    • GPU 加速:自动调用 GPU 资源,大幅提升计算速度。需要浏览器启用 WebGPU 特性

    速度

    以 M4 芯片的 Mac mini 作为示例

    • 向量计算速度约 170 条/秒
    • 聚类速度,半径在 0.15 时,5000 条数据 1 秒内完成

    示例展示

    示例图片链接

    项目源码

    https://github.com/YangHanqing/Text2VectorCluster-Web-ZH

    3 条回复
    xuelang
        1
    xuelang  
       6 天前
    不错不错,不过浏览器上目前有啥应用场景呢
    a302800411
        2
    a302800411  
    OP
       6 天前 via iPhone   ❤️ 1
    @xuelang 适合一些有聚类需求,又不会 python 搭建项目的非程序员群体
    xuelang
        3
    xuelang  
       6 天前
    嗯嗯,确实,文本聚类还是挺有用的
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2611 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 06:47 · PVG 14:47 · LAX 22:47 · JFK 01:47
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.