胡安·曼纽尔·奥尔蒂斯·德·萨拉特,阿根廷布宜诺斯艾利斯,Ciudad de Buenos Aires开发商
Juan is available for hire
Hire Juan

胡安·曼纽尔·奥尔蒂斯·德·萨拉特

Verified Expert  in Engineering

数据科学家和开发人员

Location
布宜诺斯艾利斯城,阿根廷布宜诺斯艾利斯
Toptal Member Since
November 6, 2019

Currently, 胡安是布宜诺斯艾利斯大学的博士候选人, 研究人工智能的主题, NLP, and social networks. 他拥有超过十年的专业开发经验. For the last few years, 他一直沉浸在各种类型的数据科学项目中,热爱其中的每一分钟. 胡安喜欢处理数据问题, 建立预测模型, 学习最先进的技术.

Portfolio

P36 Labs
人工智能,GPT, OpenAI GPT-3 API, OpenAI GPT-4 API...
Fundar
人工智能、大数据、自然语言处理(NLP)...
布宜诺斯艾利斯大学
R, Python, Web Scraping

Experience

Availability

Part-time

Preferred Environment

RStudio, Jupyter Notebook

The most amazing...

...我写的是一个监控社交网络的网页应用. 它的后端是R语言,用于统计数据,前端是PHP.

Work Experience

Chief Developer

2022 - PRESENT
P36 Labs
  • 开发了一款手机应用来谈判足球合同. 这款应用与Whatsapp非常相似,但可以在聊天中附加合同, creating the terms, voting them, 通过GPT生成合同文本, and finally signing it.
  • 领导由我、高级程序员、初级程序员和测试人员组成的开发团队.
  • 开发了AI功能,根据投票的条款和雇佣球员的俱乐部的语言编写合同.
  • 管理应用上传到Play Store、app Store和Amazon服务器的过程.
  • Charged with evaluating, selecting, 承包外部邮寄服务, hosting, signing, database, and more.
  • 管理与客户端的关系,以定义功能、UX、UI和时间表.
Technologies: 人工智能,GPT, OpenAI GPT-3 API, OpenAI GPT-4 API, 生成预训练变压器(GPT), 生成预训练变压器3 (GPT-3), React Native, Node.. js、MongoDB、亚马逊网络服务(AWS)

Senior Data Scientist

2022 - PRESENT
Fundar
  • 管理和监督外部学生的研究.
  • 与内部和外部成员一起管理一个不同类型的研究项目.
  • 面试外部合作者和顾问,以聘请特定项目和技术工作.
Technologies: 人工智能、大数据、自然语言处理(NLP), 生成预训练变压器(GPT), GPT, Team Management, Hiring, Data Analysis, Web Scraping

Ph.D. Student Researcher

2017 - PRESENT
布宜诺斯艾利斯大学
  • 用R和Python创建了新的技术来分析社交网络上的讨论.
  • 预测电影评论使用IMDB数据库与R.
  • 通过Python模型使用NLP预测隐含子句.
  • 使用R和Python开发新技术来预测社交网络上与NLP技术的争议.
  • 使用Python和R在社交网络上使用NLP技术创建了新的聚类图技术.
技术:R, Python, Web抓取

自由数据科学家顾问

2016 - PRESENT
Massomedia S.A.
  • 使用Python通过电话调查预测总统投票.
  • 使用R分析了Twitter和Facebook上的几个讨论.
  • 使用R, PHP和MySQL开发了一个web应用程序来监控社交网络和媒体.
  • 用Python开发了一个产品,可以分析关于产品销售的电话调查.
  • 向客户展示每项任务的结果、结论和解释.
技术:Python, R语言,Web抓取

R Specialist

2023 - 2023
Beryl资本管理有限责任公司
  • 配置并安装了一个脚本,用于从代理下载和分析数据.
  • 修复损坏的R库以修复财务脚本.
  • 连接到客户端的电脑并实时聊天以测试脚本并应用所有修复.
Technologies: R, RStudio, SharePoint, Financial Data, Stock Market, Bloomberg, Bloomberg Terminal, Bloomberg API

Front-end Developer

2022 - 2022
Nixtla Inc.
  • 用TypeScript为JupyterLab开发新的自定义插件.
  • 研究了JupyterLab文档,了解如何创建新特性.
  • 记录了新特性的创建,以及如何在新环境中扩展和安装它们.
Technologies: CSS, TypeScript, Front-end, Jupyter, Jupyter Notebook, Data Science, Forecasting, JupyterLab

Technical Editor

2021 - 2022
Auth0
  • 更正和编辑有关最新技术实现的技术文章.
  • 本文中描述的经过测试的技术实现.
  • 评估来自世界各地的作家申请公司作家计划.
技术:Python 3, PHP,技术写作,写作 & 编辑,Auth0,认证,授权

Head Teaching Assistant

2020 - 2022
布宜诺斯艾利斯大学
  • 担任数据组织学科的首席助教. 在这门课程中,我们试图向学生介绍数据科学. 本课程是信息工程专业必修职业规划的一部分.
  • 与另一位教授一起设计所有的课程内容. 因为新冠肺炎封锁, all of the online classes (in Spanish) are available on YouTube; if you would like to view them, contact me for the link.
  • 教一半的理论课和一半的实践课. 我还要协调实践课的老师,准备和批改期末考试和实践作业.
  • 设计了期末考试和学生必须批准完成的实际作业.
技术:大学教学,数据科学,教育,机器学习

Data Scientist

2021 - 2021
Carrie Beam Consulting
  • 在R中创建了新的功能,以提供财务关系图表,表明新的工会可以改善参与者之间的贸易.
  • 优化图形算法,使其能够处理大型数据集.
  • 发现现有R代码中的错误,并提出更好的建议.
技术:图,图,R,网络,计算机科学

Teaching Assistant

2020 - 2021
阿根廷大学Católica
  • 为数据科学课程编写实践课程.
  • 数据科学科目的修正考试和实践作业.
  • 辅导和回答学生关于数据科学主题的问题.
  • 解释机器学习技术, regularizations methods, 特征提取与选择, data visualization methods, 以及更多与数据科学相关的任务.
Technologies: Data Science

Statistical Developer

2020 - 2020
中央公园顾问有限责任公司
  • Predicted Bitcoin 1D, 3D, 和7D回归与多项回归和广义加性模型(GAMs).
  • Predicted Bitcoin 1D, 3D, 7D为正负值,分类模型为randomForest, XGBoost, and Bagging.
  • 通过Jupyter notebook和R Shiny动态图形报告结果.
技术:RStudio Shiny, R, Jupyter, Matplotlib, Pandas, Scikit-learn, Python

Data Analyst

2020 - 2020
LL Media, LLC
  • 使用Python和Pandas标准化了关于潜在客户的多个信息源.
  • 使用Python在不同类型的活动中对每个源的性能进行评分, Pandas, and Matplotlib.
  • 使用机器学习分类器scikit-learn通过人口统计数据预测良好的潜在客户.
  • 使用机器学习分类器scikit-learn通过人口统计数据预测不良线索.
  • 分析引线数据,找出引线表现好坏之间的简单相关性.
技术:Matplotlib, Pandas, Scikit-learn, Python,数据工程

Teaching Assistant

2017 - 2018
布宜诺斯艾利斯大学
  • 为计算机结构1班编写实践课.
  • 计算机结构1课程的批改试题和实践作业.
  • 在计算机结构1课上辅导并回答学生的问题.
技术:结构,计算机

Teaching Assistant

2016 - 2017
布宜诺斯艾利斯大学
  • 为网络理论课编写并讲授实践课.
  • 网络理论课程的考试和作业批改.
  • 辅导和回答学生在网络理论课上的问题.
技术:网络理论

高级全栈开发人员

2014 - 2015
Telam
  • 开发和维护记者系统, 这使得他们可以写不同类型的笔记并将其发布在新闻网站上.
  • 建立并维护广告费管理系统.
  • 开发REST API与其他媒体新闻网站连接.
技术:JavaScript, MySQL, PHP,后端

高级全栈开发人员

2010 - 2014
Intraway
  • 建立并维护呼叫中心协助系统.
  • 开发和维护功能,与机顶盒系统沟通并重置它们.
  • 构建并支持动态决策树,根据客户的具体问题和配置为其提供最佳答案.
  • 创建并维护内部票据系统,以组织任务并将其分配给不同的团队.
技术:jQuery, JavaScript, SQL, PHP,后端,前端

Principal Developer

2008 - 2010
Imprek
  • 制定公司的管理制度.
  • 建立技术服务管理系统.
  • 维护库存系统.
  • 实现了一个从柯达机器上打印数码照片的系统.
  • 开发公司的财务系统.
技术:JavaScript, MySQL, PHP

Data scientist at Fundar

我是Fundar的一名数据科学家研究员. Fundar是一个致力于研究的组织, researching, 制定公共政策,重点发展一个可持续和包容的阿根廷. 在那里,我为不同的政府部门工作过, 比如旅游部, 总统秘书, and more. Also, 我必须指导基金会给来自不同大学的学生提供的研究奖学金.

布宜诺斯艾利斯大学数据科学教授

http://orga-de-datos.github.io/
我和另一位教授一起设计了所有的课程内容.
我负责教授理论和实践课程, 纠正和设计期中考试, and taking final tests. 因为新冠肺炎封锁, all of the online classes (in Spanish) are available on YouTube; if you would like to view them, contact me for the link.

Technical Editor

http://auth0.com/blog/
我应该纠正和审查不同作者为Auth0技术博客写的技术文章. 文章的主题包括不同的领域:机器学习, security, developing frameworks, design patterns, and more.
我还应该测试作者在本文中开发的应用程序或代码,看看它们是否设计和实现得很好.

社会网络分析在R和Gephi:挖掘到Twitter

http://chgd.ngskmc-eis.net/r/social-network-analysis-in-r-gephi-tutorial
在本文中,我将展示如何使用Twitter API、R和Gephi进行社交网络分析. 通过下载一个特定的对话, I build the social graph, 通过一个有意义的布局来绘制它, 并确定其主要群落.

用R和Gephi理解Twitter动态:文本分析和中心性

http://chgd.ngskmc-eis.net/r/social-network-analysis-in-r-gephi-2
In this second article, 我应用中心性度量来检测讨论的主要参与者,并使用自然语言处理技术来理解他们在每个社区中谈论的内容.

集成方法:Kaggle机器学习冠军

http://chgd.ngskmc-eis.net/machine-learning/ensemble-methods-kaggle-machine-learn
三个臭皮匠胜过一个诸葛亮. 这句谚语描述了机器学习中集成方法背后的概念. 在本文中,我将研究为什么集成在ML竞赛中占据主导地位,以及是什么让它们如此强大.

展望数据科学的未来

http://jmanuoz.github.io/a-reflection-on-the-future-of-AI.html
数据科学正在改变世界,它是第四次技术革命的核心. But how do we get here? How is the world changing? 这个未来还能有什么?
In this article, 我将介绍数据科学对我们生活的影响, how we get here, some representative cases, and where we are going.

2021年要使用的十大最佳数据科学开发框架

在一个数据比石油更有价值的世界里, 对数据科学家和分析师的需求正在飙升. 在本文中,我将介绍利用这些数据储备的最佳工具. Hands down, 对于任何想要进入数据分析领域的有抱负的开发人员来说,Python是一个明确的选择.

通过调查预测总统选举

通过电话调查,我预测了犹豫不决的选民的投票.
我使用聚类和机器学习技术检测到未决定的人接近哪个政治集群. 有了这些信息,我就能非常准确地预测他们的投票结果.

应用程序监控社会网络

I developed, on my own, 一个完整的应用程序来监控像Instagram这样的社交网络, Facebook, and Twitter. 它有任何需要的公共帐户的统计数据,如果有重要的事情发生,它会通过电报向客户端发送消息/警报.

它在R中有一个后端来下载信息, process it, 并计算统计数据和PHP前端显示数据. 我还使用C来管理会话、创建、删除、修改搜索等等.

星星重新排列:改进IMDb评级系统

http://chgd.ngskmc-eis.net/data-science/improving-imdb-rating-system
IMDb的评分存在类型偏见:例如,电视剧往往得分更高. 有没有办法消除这种偏见,发现电影的独特之处?

In this article, 我将向您展示如何通过数据科学和机器学习技术改进IMDb分数并创建更好的排名系统.

Predicting Kindle Reviews

在这个项目中,我使用fastText开发了一个自然语言处理(NLP)模型. 这个模型的目的是预测读者对Kindle的评价是否积极, neutral, 或者根据用户写的文本否定.

雇用数据科学家-最佳实践和职位描述模板

招聘IT候选人是人力资源专业人员必须完成的最难的任务之一. 对IT专业人员的需求大于市场上可用的个人, 这就导致了公司之间对几乎没有资格的开发者的竞争.
In this article, 我建议你如何改进候选人的研究,并为你的团队雇佣最好的人.

Languages

PHP 7, Python, Python 3, R, SQL, JavaScript, CSS, PHP, TypeScript, HTML

Frameworks

RStudio Shiny, CodeIgniter, .NET, React Native

Libraries/APIs

igraph, Scikit-learn, Matplotlib, Pandas, Keras, Ggplot2, NumPy, jQuery, Caret, TensorFlow, Bloomberg API, Node.js

Paradigms

数据科学、测试驱动开发(TDD)

Platforms

RStudio, Jupyter Notebook, Linux, WordPress, Oracle, Gephi, SharePoint, Bloomberg Terminal, Kindle, Amazon Web Services (AWS)

Storage

MySQL, MongoDB

Other

Data Visualization, Charts, Social Networks, Social Network Analysis, Visualization Tools, OOP Designs, Machine Learning, Data Analytics, Data Analysis, Big Data, 自然语言处理(NLP), 人工智能(AI), OpenAI GPT-3 API, OpenAI GPT-4 API, Leads, Data Preprocessing, Education, Time Series, Time Series Analysis, Clustering, Statistics, Code Review, Source Code Review, Team Management, Interviewing, 生成预训练变压器(GPT), Deep Learning, 生成预训练变压器3 (GPT-3), 大型语言模型(llm), Cloud, Feature Analysis, Web Scraping, Network Theory, Computer, Structure, University Teaching, Stock Market, Stock Trading, Graphs, Networks, Computer Science, Writing & Editing, Hiring, Technical Writing, Authentication, Authorization, Back-end, Front-end, Data Engineering, Forecasting, JupyterLab, Blogging, Blog Posting, Technical Hiring, Financial Data, GPT, fastText, Neural Networks, Deep Neural Networks, ChatGPT, LangChain, Data Scientist

Tools

Dplyr, Seaborn, Jupyter, Auth0, Bloomberg

2017 - 2022

Ph.D. 计算机科学学位(正在攻读)

布宜诺斯艾利斯大学-布宜诺斯艾利斯,阿根廷

2010 - 2016

计算机科学硕士学位

布宜诺斯艾利斯大学-布宜诺斯艾利斯,阿根廷

AUGUST 2023 - PRESENT

具有大型语言模型的生成式AI

Coursera

JULY 2023 - PRESENT

LangChain:与数据聊天

Coursera

FEBRUARY 2023 - PRESENT

开发人员的ChatGPT提示工程

Coursera

DECEMBER 2018 - PRESENT

Deep Learning

Coursera

OCTOBER 2018 - PRESENT

改进深度神经网络:超参数调优、正则化和优化

Coursera

SEPTEMBER 2018 - PRESENT

机器学习实验室

ITBA | Instituto Tecnológico de Buenos Aires