过分!虾皮被曝大范围毁约;深度学习技巧全辑;MongoDB开源替代 4.7K★;剑指Offer解题代码;大数据算法笔记汇总;前沿论文 | ShowMeAI资讯日报-程序员宅基地

技术标签: ShowMeAI资讯日报 首席AI资讯收纳官  计算机视觉  人工智能  pytorch  transformer  mongodb  

ShowMeAI日报系列全新升级!覆盖AI人工智能 工具&框架 | 项目&代码 | 博文&分享 | 数据&资源 | 研究&论文 等方向。点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。

太过分!虾皮Shopee新加坡被曝大范围毁约,马上入职被收回offer,猝不及防

Shopee 是新加坡互联网集团SEA旗下的明星公司,在东南亚的电商业务领域大杀四方,能在多个市场压制阿里旗下的 Lazada,承担着『东南亚最像中国互联网大厂的超级公司』期待,也成为中国互联网人才涌入新加坡最热门的目的地。

然而,不少求职者在脉脉爆出,自己临近入职却被 Shopee 通知收回 Offer。签了合同,拿了签证,租了房子,买了机票,甚至已经落地新加披,工作却没了。签证、工作、回国成本等问题都很棘手,完全措手不及。

工具&框架

『lm-debugger』用于检查和调整基于transformer语言模型的交互式工具

https://github.com/mega002/lm-debugger

LM-Debugger 是一个开源的交互式工具,用于检查和调整基于 transformer 的语言模型。GitHub 上的资源库包括在 GPT2 Large 和 GPT2 Medium 上运行 LM-Debugger 所需的代码和数据文件的链接,它可以快速适应于其他模型,只需要改变后台的 API。

『camviz』单目深度估计结果可视化库

https://github.com/TRI-ML/camviz

https://www.tri.global/

CamViz 是一个由TRI-ML团队开发的可视化库,目的是为单目深度估计结果的可视化提供一个接口,包括深度图和重建的点云。它使用PyGame进行窗口显示和输入管理,并使用OpenGL进行二维和三维绘图和渲染。它提供了一种简单而直观的方式将信息存储为纹理和数据缓冲区,以便高效显示,也能快速创建用于图像显示的2D环境和用于点云可视化的3D环境。

『surgeon-pytorch』检视PyTorch模型中间层的工具库

https://github.com/archinetai/surgeon-pytorch

surgeon-pytorch 是一个辅助工具库,可以在不修改代码的情况下检查 PyTorch 模型的中间层。这对于获取语言模型的注意矩阵、可视化层嵌入或对中间层应用损失函数都是很有用的。它还支持提取模型的子部分,并独立运行、调试或者训练它们。借助 Surgeon 可以快速完成上述任务,无需改变原始模型的任何一行。

『xh』Rust写的用来发送HTTP请求的友好快速的工具

https://github.com/ducaale/xh

xh是一个友好和快速发送HTTP请求的工具。它重新实现了HTTPie的优秀设计,重点是提高性能。

『FerretDB』类似MongoDB的开源数据服务 · 4.7k Stars

https://github.com/FerretDB/FerretDB

https://www.ferretdb.io/

MongoDB 是一项改变许多开发者生活的技术,使他们能够比使用关系型数据库更快地构建应用程序。然而 MongoDB 放弃了它的开源根基,将许可证改为 SSPL,使其无法用于许多开源和商业项目。对于那些习惯使用 MongoDB 的开发者来说,FerretDB 是一个完美的解决方案,可视作可替代 MongoDB 的开源软件。

博文&分享

『Sketching Algorithms for Big Data』大数据算法基础课·笔记集锦

https://www.sketchingbigdata.org/fall17/lec/

『剑指 Offer』Python/Java/C++解题代码,『LeetBook 图解算法数据结构』配套代码

https://github.com/krahets/LeetCode-Book

LeetBook《图解算法数据结构》面向算法初学者、互联网求职者设计,主要内容包括:剑指 Offer 图文题解、数据结构与算法专栏。作者将内容整理成『剑指 Offer 一个月刷题计划』,核心理念为从易到难、从基础类题目到综合类题目,可以按照知识点类型顺序刷题,一个月搞定!

数据&资源

『MedMCQA』大规模多项选择题问答数据集,旨在解决现实世界的医学入学考试问题

https://github.com/medmcqa/medmcqa

https://medmcqa.github.io/

MedMCQA 拥有超过 19.4万个高质量的 AIIMS 和 NEET PG入学考试题,每个样本都包含一个问题、正确答案和其他需要更深入的语言理解的选项,为自然语言处理社区提供了一个开源数据集。

数据集涵盖 2.4k 个医疗保健主题,收集了麻醉、解剖学、生物化学、牙科、耳鼻喉科、眼科、骨科、儿科、精神病学、放射学等 21 个医学主题,主题多样性很高。

『Efficient Deep Learning』高效深度学习:深度学习过程加速技巧集

https://github.com/Mountchicken/Efficient-Deep-Learning

深度学习飞速发展,吸引着越来越多的学习者和从业者涌向了这个领域。作者整理汇总了自己在深度学习的过程中遇到了各种各样的问题和解决方案,让你获取高效深度学习的技巧。

Repo 包含高效编码的策略、高效数据处理的策略、加快训练过程的策略、提高 GPU 利用率的策略、有用工具的列表等6个部分,每个部分包含几篇文章,详细讲解各主题的技巧细节。

研究&论文

公众号回复关键字日报,免费获取整理好的论文合辑。

科研进展

  • 2022.07.25 『图像超分辨率变换』 Reference-based Image Super-Resolution with Deformable Attention Transformer
  • 2022.07.30 『数据提炼』Delving into Effective Gradient Matching for Dataset Condensation
  • 2022.07.20 『联邦学习』FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning
  • 2022.07.28 『目标检测』HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

论文:Reference-based Image Super-Resolution with Deformable Attention Transformer

论文时间:25 Jul 2022

领域任务:Image Super-Resolution,图像超分辨率变换

论文地址:https://arxiv.org/abs/2207.11938

代码实现:https://github.com/caojiezhang/datsr

论文作者:JieZhang Cao, Jingyun Liang, Kai Zhang, Yawei Li, Yulun Zhang, Wenguan Wang, Luc van Gool

论文简介:Reference-based image super-resolution (RefSR) aims to exploit auxiliary reference (Ref) images to super-resolve low-resolution (LR) images./基于参考的图像超分辨率(RefSR)旨在利用辅助参考(Ref)图像来超解低分辨率(LR)图像。

论文摘要:基于参考的图像超分辨率(RefSR)旨在利用辅助参考(Ref)图像来超解低分辨率(LR)图像。最近,RefSR已经引起了极大的关注,因为它提供了一种超越单幅图像SR的替代方法。然而,解决RefSR问题有两个关键的挑战:(i)当LR图像和参考图像有明显的不同时,很难匹配它们之间的对应关系;(ii)如何从参考图像中转移相关纹理以补偿LR图像的细节是非常具有挑战性的。为了解决RefSR的这些问题,本文提出了一种具有多个尺度的可变形注意力Transformer,即DATSR,每个Transformer由纹理特征编码器(TFE)模块、基于参考的可变形注意力(RDA)模块和残余特征聚合(RFA)模块组成。具体来说,TFE首先为LR和Ref图像提取对图像变换(如亮度)不敏感的特征,然后RDA可以利用多种相关纹理来补偿LR特征的更多信息,最后RFA将LR特征和相关纹理聚合起来,得到视觉上更愉悦的结果。广泛的实验表明,我们的DATSR在数量和质量上都达到了基准数据集的最先进性能。

论文:Delving into Effective Gradient Matching for Dataset Condensation

论文时间:30 Jul 2022

领域任务:Dataset Condensation,数据提炼

论文地址:https://arxiv.org/abs/2208.00311

代码实现:https://github.com/Guang000/Awesome-Dataset-Distillation

论文作者:Zixuan Jiang, Jiaqi Gu, Mingjie Liu, David Z. Pan

论文简介:In this work, we delve into the gradient matching method from a comprehensive perspective and answer the critical questions of what, how, and where to match./在这项工作中,我们从一个全面的角度深入研究了梯度匹配方法,并回答了什么、如何以及在哪里匹配等关键问题。

论文摘要:随着深度学习模型和数据集的迅速扩大,网络训练是非常耗时和资源成本的。与其在整个数据集上进行训练,用一个小的合成数据集进行学习成为一个有效的解决方案。在数据集提炼的方向上已经进行了广泛的研究探索,其中梯度匹配取得了最先进的性能。梯度匹配方法通过在原始数据集和合成数据集上训练时的梯度匹配直接针对训练动态。然而,对这种方法的原理和效果的深入研究是有限的。在这项工作中,我们从全面的角度深入研究梯度匹配方法,并回答了匹配什么、如何匹配、在哪里匹配等关键问题。我们提出,多级梯度的匹配要同时涉及类内和类间的梯度信息。我们证明了距离函数应该集中在角度上,同时考虑幅度以延迟过拟合。我们还提出了一个过拟合感知的自适应学习步骤策略,以修剪不必要的优化步骤,提高算法效率。消融和比较实验表明,与先前的工作相比,我们提出的方法显示出更高的准确性、效率和通用性。

论文:FedDM: Iterative Distribution Matching for Communication-Efficient Federated Learning

论文时间:20 Jul 2022

领域任务:Federated Learning, Image Classification,联邦学习图像分类

论文地址:https://arxiv.org/abs/2207.09653

代码实现:https://github.com/Guang000/Awesome-Dataset-Distillation/blob/main/README.md

论文作者:Yuanhao Xiong, Ruochen Wang, Minhao Cheng, Felix Yu, Cho-Jui Hsieh

论文简介:Federated learning~(FL) has recently attracted increasing attention from academia and industry, with the ultimate goal of achieving collaborative training under privacy and communication constraints./联邦学习~(FL)最近引起了学术界和工业界越来越多的关注,其最终目标是在隐私和通信约束下实现协作训练。

论文摘要:联邦学习~(FL)最近吸引了学术界和工业界越来越多的关注,其最终目标是在隐私和通信约束下实现协作训练。现有的基于迭代模型平均化的FL算法需要大量的通信回合来获得一个表现良好的模型,这是因为不同client之间的数据划分极不平衡且非i.i.d。因此,我们提出了FedDM,从多个本地代理函数中建立全局训练目标,这使得服务器能够获得一个更全局的损失景观。详细来说,我们在每个client上构建合成的数据集,通过分布匹配与原始数据的损失景观进行局部匹配。与笨重的模型权重相比,FedDM通过传输更多信息和更小的合成数据,减少了通信回合,提高了模型质量。我们在三个图像分类数据集上进行了广泛的实验,结果表明,我们的方法在效率和模型性能方面可以超过其他FL对应的方法。此外,我们证明FedDM可以适应高斯机制,以保护差异化的隐私,并在相同的隐私预算下训练一个更好的模型。

论文:HorNet: Efficient High-Order Spatial Interactions with Recursive Gated Convolutions

论文时间:28 Jul 2022

领域任务:Image Classification, object-detection, 图像分类目标检测

论文地址:https://arxiv.org/abs/2207.14284

代码实现:https://github.com/raoyongming/hornet

论文作者:Yongming Rao, Wenliang Zhao, Yansong Tang, Jie zhou, Ser-Nam Lim, Jiwen Lu

论文简介:In this paper, we show that the key ingredients behind the vision Transformers, namely input-adaptive, long-range and high-order spatial interactions, can also be efficiently implemented with a convolution-based framework./在本文中,我们展示了视觉Transformers背后的关键成分,即输入自适应、长距离和高阶空间互动,也可以通过基于卷积的框架有效实现。

论文摘要:最近在视觉Transformers方面取得的进展显示,在基于点积自我注意的新空间建模机制的驱动下,在各种任务中取得了巨大的成功。在本文中,我们展示了视觉Transformers背后的关键成分,即输入自适应、长距离和高阶空间互动,也可以通过基于卷积的框架有效地实现。我们提出了递归门控卷积(gnConv),用门控卷积和递归设计来执行高阶空间互动。新的操作是高度灵活和可定制的,它与卷积的各种变体兼容,并将自我注意中的两阶互动扩展到任意的阶数,而不引入大量的额外计算。gnConv可以作为一个即插即用的模块来改进各种视觉Transformers和基于卷积的模型。基于该操作,我们构建了一个新的通用视觉骨干系列,名为HorNet。在ImageNet分类、COCO物体检测和ADE20K语义分割上的大量实验表明,HorNet在整体架构和训练配置相似的情况下,比Swin Transformers和ConvNeXt要好得多。HorNet还显示了对更多训练数据和更大模型规模的有利可扩展性。除了在视觉编码器中的有效性外,我们还表明gnConv可以应用于特定任务的解码器,并以较少的计算量持续提高密集预测性能。我们的结果表明,gnConv可以成为一个新的视觉建模的基本模块,有效地结合了视觉变形器和CNN的优点。代码可在 https://github.com/raoyongming/HorNet 获取。

我们是 ShowMeAI,致力于传播AI优质内容,分享行业解决方案,用知识加速每一次技术成长!点击查看 历史文章列表,在公众号内订阅话题 #ShowMeAI资讯日报,可接收每日最新推送。点击 专题合辑&电子月刊 快速浏览各专题全集。点击 这里 回复关键字 日报 免费获取AI电子月刊与资料包。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/ShowMeAI/article/details/126533913

智能推荐

分布式光纤传感器的全球与中国市场2022-2028年:技术、参与者、趋势、市场规模及占有率研究报告_预计2026年中国分布式传感器市场规模有多大-程序员宅基地

文章浏览阅读3.2k次。本文研究全球与中国市场分布式光纤传感器的发展现状及未来发展趋势,分别从生产和消费的角度分析分布式光纤传感器的主要生产地区、主要消费地区以及主要的生产商。重点分析全球与中国市场的主要厂商产品特点、产品规格、不同规格产品的价格、产量、产值及全球和中国市场主要生产商的市场份额。主要生产商包括:FISO TechnologiesBrugg KabelSensor HighwayOmnisensAFL GlobalQinetiQ GroupLockheed MartinOSENSA Innovati_预计2026年中国分布式传感器市场规模有多大

07_08 常用组合逻辑电路结构——为IC设计的延时估计铺垫_基4布斯算法代码-程序员宅基地

文章浏览阅读1.1k次,点赞2次,收藏12次。常用组合逻辑电路结构——为IC设计的延时估计铺垫学习目的:估计模块间的delay,确保写的代码的timing 综合能给到多少HZ,以满足需求!_基4布斯算法代码

OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版-程序员宅基地

文章浏览阅读3.3k次,点赞3次,收藏5次。OpenAI Manager助手(基于SpringBoot和Vue)_chatgpt网页版

关于美国计算机奥赛USACO,你想知道的都在这_usaco可以多次提交吗-程序员宅基地

文章浏览阅读2.2k次。USACO自1992年举办,到目前为止已经举办了27届,目的是为了帮助美国信息学国家队选拔IOI的队员,目前逐渐发展为全球热门的线上赛事,成为美国大学申请条件下,含金量相当高的官方竞赛。USACO的比赛成绩可以助力计算机专业留学,越来越多的学生进入了康奈尔,麻省理工,普林斯顿,哈佛和耶鲁等大学,这些同学的共同点是他们都参加了美国计算机科学竞赛(USACO),并且取得过非常好的成绩。适合参赛人群USACO适合国内在读学生有意向申请美国大学的或者想锻炼自己编程能力的同学,高三学生也可以参加12月的第_usaco可以多次提交吗

MySQL存储过程和自定义函数_mysql自定义函数和存储过程-程序员宅基地

文章浏览阅读394次。1.1 存储程序1.2 创建存储过程1.3 创建自定义函数1.3.1 示例1.4 自定义函数和存储过程的区别1.5 变量的使用1.6 定义条件和处理程序1.6.1 定义条件1.6.1.1 示例1.6.2 定义处理程序1.6.2.1 示例1.7 光标的使用1.7.1 声明光标1.7.2 打开光标1.7.3 使用光标1.7.4 关闭光标1.8 流程控制的使用1.8.1 IF语句1.8.2 CASE语句1.8.3 LOOP语句1.8.4 LEAVE语句1.8.5 ITERATE语句1.8.6 REPEAT语句。_mysql自定义函数和存储过程

半导体基础知识与PN结_本征半导体电流为0-程序员宅基地

文章浏览阅读188次。半导体二极管——集成电路最小组成单元。_本征半导体电流为0

随便推点

【Unity3d Shader】水面和岩浆效果_unity 岩浆shader-程序员宅基地

文章浏览阅读2.8k次,点赞3次,收藏18次。游戏水面特效实现方式太多。咱们这边介绍的是一最简单的UV动画(无顶点位移),整个mesh由4个顶点构成。实现了水面效果(左图),不动代码稍微修改下参数和贴图可以实现岩浆效果(右图)。有要思路是1,uv按时间去做正弦波移动2,在1的基础上加个凹凸图混合uv3,在1、2的基础上加个水流方向4,加上对雾效的支持,如没必要请自行删除雾效代码(把包含fog的几行代码删除)S..._unity 岩浆shader

广义线性模型——Logistic回归模型(1)_广义线性回归模型-程序员宅基地

文章浏览阅读5k次。广义线性模型是线性模型的扩展,它通过连接函数建立响应变量的数学期望值与线性组合的预测变量之间的关系。广义线性模型拟合的形式为:其中g(μY)是条件均值的函数(称为连接函数)。另外,你可放松Y为正态分布的假设,改为Y 服从指数分布族中的一种分布即可。设定好连接函数和概率分布后,便可以通过最大似然估计的多次迭代推导出各参数值。在大部分情况下,线性模型就可以通过一系列连续型或类别型预测变量来预测正态分布的响应变量的工作。但是,有时候我们要进行非正态因变量的分析,例如:(1)类别型.._广义线性回归模型

HTML+CSS大作业 环境网页设计与实现(垃圾分类) web前端开发技术 web课程设计 网页规划与设计_垃圾分类网页设计目标怎么写-程序员宅基地

文章浏览阅读69次。环境保护、 保护地球、 校园环保、垃圾分类、绿色家园、等网站的设计与制作。 总结了一些学生网页制作的经验:一般的网页需要融入以下知识点:div+css布局、浮动、定位、高级css、表格、表单及验证、js轮播图、音频 视频 Flash的应用、ul li、下拉导航栏、鼠标划过效果等知识点,网页的风格主题也很全面:如爱好、风景、校园、美食、动漫、游戏、咖啡、音乐、家乡、电影、名人、商城以及个人主页等主题,学生、新手可参考下方页面的布局和设计和HTML源码(有用点赞△) 一套A+的网_垃圾分类网页设计目标怎么写

C# .Net 发布后,把dll全部放在一个文件夹中,让软件目录更整洁_.net dll 全局目录-程序员宅基地

文章浏览阅读614次,点赞7次,收藏11次。之前找到一个修改 exe 中 DLL地址 的方法, 不太好使,虽然能正确启动, 但无法改变 exe 的工作目录,这就影响了.Net 中很多获取 exe 执行目录来拼接的地址 ( 相对路径 ),比如 wwwroot 和 代码中相对目录还有一些复制到目录的普通文件 等等,它们的地址都会指向原来 exe 的目录, 而不是自定义的 “lib” 目录,根本原因就是没有修改 exe 的工作目录这次来搞一个启动程序,把 .net 的所有东西都放在一个文件夹,在文件夹同级的目录制作一个 exe._.net dll 全局目录

BRIEF特征点描述算法_breif description calculation 特征点-程序员宅基地

文章浏览阅读1.5k次。本文为转载,原博客地址:http://blog.csdn.net/hujingshuang/article/details/46910259简介 BRIEF是2010年的一篇名为《BRIEF:Binary Robust Independent Elementary Features》的文章中提出,BRIEF是对已检测到的特征点进行描述,它是一种二进制编码的描述子,摈弃了利用区域灰度..._breif description calculation 特征点

房屋租赁管理系统的设计和实现,SpringBoot计算机毕业设计论文_基于spring boot的房屋租赁系统论文-程序员宅基地

文章浏览阅读4.1k次,点赞21次,收藏79次。本文是《基于SpringBoot的房屋租赁管理系统》的配套原创说明文档,可以给应届毕业生提供格式撰写参考,也可以给开发类似系统的朋友们提供功能业务设计思路。_基于spring boot的房屋租赁系统论文

推荐文章

热门文章

相关标签