远韬实验室

远韬实验室是我们努力钻研的编程技术资源汇集,有对外界资源的引用,也有远韬的积累。
外界来源遍及全球,我们不仅关注最新的技术概念和论文,也关注计算机发展史中的瑰宝,希望这些技术以及远韬同事们的思考推进可以对国内计算机同业人员有所启发和帮助。
由于计算机发展史中,有不同的”新词“来指代同一个领域,也有不同时期的词汇被不同的历史阶段赋予新的意义(尤其是商业上的造词)。远韬努力以技术人员的视角,用平实的语言,重点描述我们目前可以做到的,而不侧重于商业化概念。
主要划分以下三个方向: 

  • 自动化编程
  • 自动化情报
  • 机器视觉

 

自动化编程

在计算机科学中,"自动编程"定义了一种计算机编程方式,以某种机制生成计算机程序,让人类程序员在更高的抽象级别编写代码。
高级语言的编译器支持编译时实时代码生成机制,比如lisp的macro,灵活定制解释器来生成程序,生产环境中,可以使用比如在JVM上实现的lisp方言clojure。 

macro可以使语言更加强大,允许开发人员在语言本身中定义新语法,也就是“产生其他代码的代码”,在当代的编程语言中,这种特征被称为元编程(meta-programming)。

元编程其实是一种编程思想,计算机程序能够将函数视为其数据。 这意味着函数可以设计为读取、生成、分析或转换其他函数,甚至在运行时修改自身。 有了这些特性就可以方便的构建领域编程语言(DSL)。

远韬维护着一个小而精的中文clojure社区(在建设中)。

近期,自动编程的实现方法是通过机器学习,通过海量的代码进行引擎训练,这方面的成就已经被运用,比如github 发布的Copilot以及deepmind发布的AlphaCode

 

自动化情报

信息的分析处理不仅是人类智力的核心,也同样是机器智能的核心。机器分析处理信息主要是采用自然语言处理技术(Natural Language Processing),基于语言学、统计学、逻辑推理等组成的一系列算法,处理语言信息。
传统的自然语言处理技术以语言学为基础,利用统计、逻辑推理等数学方法进行处理。近些年随着机器学习,特别是深度学习和神经网络的发展,自然语言处理技术有了很大的变化。现代的自然语言处理的发展重点从基于语言过渡到了基于机器学习,特别是在翻译领域,通过机器学习建立的模型进行的翻译,已经可以基本达到人类翻译水平。
我们也在使用自然语言处理技术,包括传统基于语言、统计的,以及现代基于机器学习的方法进行信息的自动化处理,聚焦在信息提取、关系识别、情感分析、信息生成。现在主要的研究方向包括:

  • 通过深度学习和神经网络增强语言理解
  • 通过深度学习和神经网络自动生成情报

关于生成式AI的飞速进展,也有来自大神的不同的理性声音。图灵奖获得者, 计算机科学奠基之作<计算机算法艺术>的作者Donald Knuth对于chatgpt的尝试后表示: 

"It's amazing how the confident tone lends credibility to all of that made-up nonsense", "this has been a fun distraction, I’m going back to the real work and you should too."

->参考原文: Knuth对chat GDP的20个问题

 

机器视觉

机器视觉是一项综合技术,包括图像处理、机械工程技术、控制、电光源照明、光学成像、传感器、模拟与数字视频技术、计算机软硬件技术。
我们主要在工业视觉检测、3D点云处理、图像处理等领域进行了相关的研究,主要成果有普通双物镜测量、双物镜三维立体测量、基于图像处理的表面缺陷检测、视频自动生成等算法,并在电子工业内窥镜、新媒体运营等行业落地应用。现在的主要研究方向包括:

  • 基于深度学习的复杂场景下的复杂缺陷检测
  • 3D点云特征检测
  • 多传感器信息融合

 

Copyright ©2021 SHANGHAI VIEWTAO SOFTWARE CO.,LTD | All Rights Reserved  沪ICP备15053813号-11