1.HTTP概念

应用层 典型的 协议 HTTP(超文本传输协议), 它是应用最广泛的协议
作用为:将任意内容拉取到本地浏览器,让浏览器进行解释


客户端client 把自己的"东西" 给别人
同时也想把 别人的"东西" 拿到自己本地
一般称为 CS 模式

http中的网页文本 、图片 、视频、音频 统一称为资源
东西实际上就是资源

2. URL

要访问服务器,就必须知道服务器的IP地址和端口号

需要有一个 域名解析服务
如: baidu.com (域名) 解析成 110.242.68.4(IP地址)

如:QQ官网

https 作为协议
www.qq.com 作为服务器地址

server的端口号不能随意指定,必须是众所周知且不能随便更改的
端口号和成熟的应用层协议是 一 一对应的

https 常用的端口号为443
http 常用的端口号为80


协议名称 和端口号之间是一对一 ,强相关
如:附近着火了,第一时间想起的就是打119 进行救火

由于http是超文本传输协议,就需要告诉别人要访问什么资源


第一个 / 表示 web根目录
第二个 / 表示 路径分隔符
/ / 表示 URL想访问服务器的 什么资源

? 表示区分 URL 左侧 和右侧的分隔符
? 后面跟的都是参数

参数是KV的 ,=左边的 uid 可看作是K ,=右边的 1 可看作V

URL 被称为 统一资源定位符

urlencode 和 urldecode

在这里插入图片描述

  • 只搜索 ?/#: 这些特殊符号 发现特殊符号被转化为16进制格式数字
    因为URL本身用一些字符作为特殊字符,所以在使用特殊字符时,所以特殊符号被转化为16进制格式数字,用来和URL本身的特殊字符进行区分
    转化的过程 被称之为 URL的 encode编码,用于解决 URL中特殊符号的问题 这个工作是由浏览器或者客户端 自动做的
  • 服务器收到的就为 16进制格式,而不想要16进制格式,想要特殊符号 ,就需要进行 decode编码

转义规则

将需要转码的字符转为 16进制,然后从右到左,取4位(不足4位直接处理),每2位做一位,前面加上%,编码成%XY格式


点击查看:自动编码工具

在该网站上可以进行 urlencode 与urlencode 解码

3. HTTP的宏观理解

HTTP的请求

按照完整的说法,HTTP分为四部分


第一部分——请求行
HTTP的请求行,以行为单位,分为三部分 请求方法 URL 协议版本
请求方法: GET/ POST
URL:请求资源
协议版本:http/1.0 http/1.1 http/2.0
三部分之间用空格作为分隔符,把这三部分 分离开


第二部分——请求报头
由 Key:Value 所构成的多行结构


第三部分——空行
\r\n


第四部分——有效载荷
一般是用户可能提交的参数 (可以没有)

HTTP的响应

状态行 分为 协议版本 状态码 状态码描述
三部分之间用空格作为分隔符,把这三部分 分离开
协议版本:http/1.0 http/1.1 http/2.0
状态码: 如404
状态码描述 : 404所对应的含义 如:Not Found


响应报头 也是 由Key:Value 所构成的多行结构


有效载荷 可能是 html /css的文件资源,也可能是请求对应的图片等

4. 见一见HTTP请求和响应

请求报头

当从浏览器输入 主机IP+端口号 ,Linux上显示如下数据

GET / HTTP/1.1
第一行作为 请求行


由 Key Value 构成的 多行结构 作为 请求报头
并没有包含 有效载荷
Host 表示 这次请求给哪台主机,一般为目标服务器的IP地址和端口号
Connection 表示 这次请求的链接模式 长/短链接
Cache-control 表示 双方在通信时 要建立缓存,最大缓存的生存时间默认为0(不缓存)
User_Agent 表示 HTTP请求的客户端信息
Accept_Encodong 表示 作为客户端,能接受的编码和压缩类型
Accept_Language 表示 作为客户端,能接受编码符号

1. 模拟一个简单的响应response

创建一个Main.cc,通过调用 回调函数HandlerHttp的方式来实现整个过程


对于回调函数 HandlerHttp,在是一个完整的http请求报文的前提下,分别将状态行 分隔符 有效载荷 添加到 response响应中,并将 响应返回
有效载荷部分以网页部分呈现的

响应报头

进行文本分析时,按行进行分割读取,直到找到一行是空行,则认为把报头读完了

报头中key 为 Content-Length ,Value 为 Body的长度(有效载荷的长度)


当在Linux上运行程序,并输入端口号时
浏览器上 输入 主机IP+端口号 ,就会使主函数 调用回调函数 打印 this a test
同时Linux会出现如下数据 响应的 状态行 响应报头 空行 有效载荷


由于有效载荷内部分为 图片、视频、音频 资源
为了便于区分 使用 Content_Type :Body的种类


图片、视频、音频 资源 这些资源本质都是文件

图片的后缀为.png
网页的后缀为.html
视频的后缀为.mp3
Linux资源都要有自己的后缀,需要告诉别人 ,就需要 Content-Type 对照表


若后缀为.html,则 Content-Type 对照表 为 text/html
若后缀为.png,则 Content-Type 对照表 为 image/png


在响应后 添加 网页的Content-Type 对照表 text/html,以及 SEP分隔符

2. 从路径中获取内容

给http维护一个自己的目录,即 wwroot
创建 index.html 里面放入这个网页中的所有资源


创建 Until.hpp
在Until这个类中,创建一个接口 ReadFile 用于读取整个文件内容

第一个参数 path 为指定的路径
第二个参数file_content 表示输出 即文件对应的内容


path表示路径,在wwwroot目录下的index.html中获取文件
将获取到的文件交给 字符串body

ReadFile函数的实现

1. 获取文件本身的大小
输入 man 2 stat

对指定的文件路径,获取它的struct stat 属性
成功返回0,失败返回-1


st_size 表示这个文件 按字节为单位的大小
st_mode: 匹配很多的宏



2. 调整string的空间 保证能够把文件全部放下

开辟size大小个空间


3. 读取

O_RDONLY 读取


path作为路径,可以找到对应 index.html的内容,再将内容传给body字符串中,作为有效载荷

3.不同资源进行区分

只有是请求,无脑响应的都是这些资源

若请求到不同的资源,应该加以区分
用户想要什么就给他什么,没有就返回404


把request 进行处理,进行反序列化,由字符串信息变成结构化字段
创建一个 HttpRequest 结构体
里面包含 状态行的请求方法、URL、请求版本以及请求报头


在这里插入图片描述


URL作为请求资源,所以将 path替换成 req.url_ 即可

反序列化的实现

在主函数Main.cc中
创建ReadOneLine函数,将message中的第一行的请求行取出
创建 ParseRequestLine函数,将 请求行解析成 请求方法、URL、协议版本

两个函数都在Util.hpp中实现

ReadOneLine函数的实现

加上static修饰,是为了防止有隐藏的this指针存在
使用find函数寻找sep分隔符,若找到则返回pos位置的下标
使用substr函数 取出[0,pos]区间的子串 作为返回值
使用 erase函数 将下标从0开始 删除 pos+sep.size()个字符


ParseRequestLine函数的实现

sstream 流 按照空格作为分隔符,打印到三个string中

路径path的最终表示

路径path是需要加上 web根目录的

所以定义一个web根目录 webRoot


在使用请求时,先在路径path中 加入web根目录 ,再添加对应的 URL(请求资源)

4. 同时显示 文字 和 图片

点击查看:石榴花图片


在wwwroot中 创建 image文件,并进入inmage中


wget :远程获取资源的命令

使用 wget + 图片地址,获取图片


使用 mv 指令 ,将 原图片名字改为 1.jpg


此时在vscode中的 image 文件中,就可以显示图片了


一张网页包含很多要素资源,如:图片 文字 视频
每一个资源都要发起一次http请求

在浏览器中搜索 w3cschool


在HTML教程中,找到HTML图像,其中寻找到 替换文本属性


第一个/表示 web根目录 即wwwroot
在wwroot目录下找到image文件中的 1.jpg

若获取图片失败,则会显示文字 这是一张石榴花图片


由于这次资源既包含文字 又包含图片,所以类型不同,需要处理 Content-Type (body的种类)

添加成员变量,判断 要访问的是什么资源(如:图片 文字)


在反序列化函数中 使用 rfind 函数 ,从后往前 查找 字符 . ,再使用substr 函数 从下标 pos开始取len个字符
若没有给len,则一直取到path_字符串结束


在HandlerHttp函数的 使用请求中
将 Content-Type (body的种类) 进行封装成 一个GetContentType的接口

GetContentType函数的实现

若后缀为.html,则 Content-Type 对照表 为 text/html
若后缀为.css,则 Content-Type 对照表 为 test/css
若后缀为.js,则 Content-Type 对照表 为 application/x-javascript
若后缀为.png,则 Content-Type 对照表 为 image/png
若后缀为.jpg,则 Content-Type 对照表 为 image/jpeg


在浏览器 输入 主机IP+端口号 ,发现图片并没有显示,而且出现了乱码


网页必须指明编码格式,否则就会出现乱码
所以修改index.html的内容


再次输入 主机IP 和端口号 就可以同时显示 文字 和图片了

5.模拟的完整代码

wwwroot

index.html(图片)
<!DOCTYPE html>
<html lang="en">

<head>
    <meta charest="UTF-8">
    <meta name="viewport" content="width=device-width" ,initial-scale=1.0">
    <title>Document</title>
</head>

<body>
    <h1>this is a test </h1>
    <h1>this is a test </h1>
    <h1>this is a test </h1>
    <h1>this is a test </h1>
    <img src="/image/1.jpg" alt="这是一张石榴花图片">
</body>

</html>  

Err.hpp(错误)

#pragma once 

enum
{
  USAGE_ERR=1,
  SOCKET_ERR,//2
  BIND_ERR,//3
  LISTEN_ERR,//4
  SETSID_ERR,//5
  OPEN_ERR//6
};




HttpServer.hpp(初始化和启动)



#include<iostream>
#include<string>
#include<pthread.h>
#include<functional>  
#include"Sock.hpp"

static const uint16_t  defaultport=8888;//默认端口号

class HttpServer;
//定义 func_t 类型  为 返回值为string 参数为string的包装器
using func_t =std::function<std::string( std::string&)>;


   class ThreadData
   {
    public:
     ThreadData(int sock,std::string ip,const uint16_t& port,HttpServer*tsvrp)//构造
     :_sock(sock),_ip(ip),_port(port),_tsvrp(tsvrp)
     {}
     ~ThreadData()
     {}
    public:
    int _sock;//套接字
    HttpServer *_tsvrp;//指针指向Tcp服务器 
    std::string _ip;
    uint16_t   _port;
    };

class HttpServer
{
  public:
  HttpServer(func_t f,int port= defaultport)
  :func(f),port_(port)
  {}

   void InitServer()//初始化
   {
      listensock_.Socket();//创建套接字
      listensock_.Bind(port_);//绑定
      listensock_.Listen();//监听
       
   }


   void HandlerHttpRequest(int sock)//
   {
     char buffer[4096];
    std::string request;

    //将套接字的数据读取到buffer中
    ssize_t s=recv(sock,buffer,sizeof(buffer)-1,0);
     if(s>0)//读取成功
     {
        buffer[s]=0;//将'\0'赋值给buffer中
        request=buffer;
        std::string response =func(request);//回调函数 将request变为response
        send(sock,response.c_str(),response.size(),0);//发送 将respnse中的内容 发送到sock套接字中
     }
     else 
     {
        //读取失败
        logMessage(Info,"client quit ...");//打印日志 
     }
   } 
   
   static void* threadRoutine(void *args)
   {
    //线程分离 若不关心线程返回值 则提前告诉它 要进行分离
    pthread_detach(pthread_self());
    ThreadData* td=(ThreadData*)args;
    td->_tsvrp->HandlerHttpRequest(td->_sock);
    close(td->_sock);

    delete td;
    return nullptr;
   }



   void Start()//启动
   {
            for(;;)
            {
                std::string clientip;
                uint16_t clientport;
                int sock=listensock_.Accept(&clientip,&clientport);//获取客户端IP和端口号
                if(sock<0)
                {
                    continue;
                }
                pthread_t tid;
                ThreadData *td =new ThreadData(sock,clientip,clientport,this);
                pthread_create(&tid,nullptr,threadRoutine,td);
            }
   }

  ~HttpServer()
  {}
  private:
  int port_;       //端口号
  Sock listensock_;//套接字
  func_t func; //包装器类型的回调函数
};


Log.hpp(日志)

#pragma once 
#include<iostream>
#include<string.h>
#include<cstdio>
#include<cstring>
#include<cstdarg>
#include<unistd.h>
#include<sys/types.h>
#include<time.h>

const std::string  filename="tecpserver.log";

//日志等级
enum{
 Debug=0, // 用于调试
 Info  ,  //1 常规
 Warning, //2 告警
 Error ,  //3  一般错误
 Tatal ,  //4 致命错误
 Uknown//未知错误
};

static  std::string tolevelstring(int level)//将数字转化为字符串
{
  switch(level)
  {
     case  Debug : return "Debug";
     case Info : return "Info";
     case Warning : return "Warning";
     case  Error : return "Error";
     case Tatal : return "Tatal";
     default: return "Uknown";
  }
}
std::string gettime()//获取时间
{
   time_t curr=time(nullptr);//获取time_t
   struct tm *tmp=localtime(&curr);//将time_t 转换为 struct tm结构体
   char buffer[128];
   snprintf(buffer,sizeof(buffer),"%d-%d-%d %d:%d:%d",tmp->tm_year+1900,tmp->tm_mon+1,tmp->tm_mday,
   tmp->tm_hour,tmp->tm_min,tmp->tm_sec);
   return buffer;

}
void logMessage(int level, const char*format,...)
{
   //日志左边部分的实现
   char logLeft[1024];
   std::string level_string=tolevelstring(level);
   std::string curr_time=gettime();
   snprintf(logLeft,sizeof(logLeft),"%s %s %d",level_string.c_str(),curr_time.c_str());

   //日志右边部分的实现
   char logRight[1024]; 
   va_list p;//p可以看作是1字节的指针
   va_start(p,format);//将p指向最开始
   vsnprintf(logRight,sizeof(logRight),format,p);
   va_end(p);//将指针置空
   
   //打印日志 
   printf("%s%s\n",logLeft,logRight);

   //保存到文件中
   FILE*fp=fopen( filename.c_str(),"a");//以追加的方式 将filename文件打开
   //fopen打开失败 返回空指针
   if(fp==nullptr)
   {
      return;
   }
   fprintf(fp,"%s%s\n",logLeft,logRight);//将对应的信息格式化到流中
   fflush(fp);//刷新缓冲区
   fclose(fp);
}


Main.cc(回调函数调用)



#include<vector>
#include<memory>
#include"HttpServer.hpp"
#include"Util.hpp"

using namespace std;
const std::string SEP="\r\n";

const std::string defaultHomePage ="index.html";//默认首页
const std::string webRoot="./wwwroot";//web根目录

class HttpRequest
{
public:
     HttpRequest()
     :path_(webRoot)
     {}

    ~HttpRequest()
     {}

     void Print()
     {
       logMessage(Debug,"method:%s,url:%s,version:%s",method_.c_str(),url_.c_str(),httpVersion_.c_str());
       /*for(const auto&line:body_)
       {
         logMessage(Debug,"-%s",line.c_str());
       }
       */
       logMessage(Debug,"path:%s",path_.c_str());
        logMessage(Debug,"suffix:%s",suffix_.c_str());
     }
public:
    std::string method_;//请求方法
    std::string url_;   //URL
    std::string httpVersion_;//请求版本
    std::vector<std::string> body_;//请求报头

    std::string path_; //想要访问的资源

    std::string suffix_;//后缀 用于判断访问是什么资源
};

//反序列化 将字符串转化为 HttpRequest结构体
HttpRequest Deserialize(std::string &message)
{
   HttpRequest req;
   std::string line=Util::ReadOneLine(message,SEP);//在message中根据分隔符读走状态行

   //将请求行分为 请求方法 URL 协议版本
   Util::ParseRequestLine(line,&req.method_,&req.url_,&req.httpVersion_);//解析请求行

   logMessage(Info,"method:%s,url:%s,version:%s",req.method_.c_str(),req.url_.c_str(),req.httpVersion_.c_str());

   //将状态行处理后,剩余请求报头,每一次取一行 将其放入body中
   while(!message.empty())
   {
      line=Util::ReadOneLine(message,SEP);
      req.body_.push_back(line);
   }

   req.path_ += req.url_;   //path_在构造时,已经默认为web根目录了,所以只需加上资源即可

   //只有一个'/',需加上默认首页
   if(req.path_[req.path_.size()-1]=='/')
   {
      req.path_+= defaultHomePage;
   }

   auto pos=req.path_.rfind(".");
   if( pos==std::string::npos)//没找到
   { 
      req.suffix_=".html";//默认为html
   }
   else 
   {
      req.suffix_=req.path_.substr(pos);
   }
   return req;
}


std::string GetContentType(std::string &suffix)//判断是哪一种资源的后缀
{
    std::string content_type =" Content-Type: ";
    if(suffix==".html"|| suffix==".htm")
    {
      content_type+="text/html";
    }
    else if(suffix==".css ")
    {
      content_type+="text/css";
    }
    else if(suffix==".js")
    {
      content_type+="application/x-javascript";
    }
    else if(suffix==".png")
    {
       content_type+="image/png";
    }
    else if(suffix==".jpg")
    {
       content_type+="image/jpeg";
    }
    else 
    {}
    return content_type+SEP;
}
std::string HandlerHttp( std::string &message)//回调函数的实现
{
   //1.读取请求
    //request 一定是一个完整的http请求报文
    //给别人返回的 http response
    cout<<"---------------------------"<<endl;
    
    //2.反序列化和分析请求
      HttpRequest req =  Deserialize(message);
      req.Print();
    

    //3.使用请求
    std::string body;//有效载荷

    Util::ReadFile(req.path_,&body);//将path路径中的内容交给body字符串中

    //做一次响应 
    //状态行 : 协议版本 状态码 状态码描述
    //200表示请求是正确的
    std::string response="HTTP/1.0 200 OK"+SEP;//状态码

    //Content-Length获取有效载荷长度
    response+="Content-Length: "+std::to_string(body.size())+SEP;//响应报头
    response+=GetContentType(req.suffix_);

    response += SEP;  //分隔符
    response += body; //有效载荷   
    return response;
}
 int main(int argc,char* argv[])
 {  
   if(argc!=2)
   {
      exit(USAGE_ERR);
   }
  uint16_t port=atoi(argv[1]);
  std::unique_ptr<HttpServer> tsvr(new HttpServer(HandlerHttp,port));
  tsvr->InitServer();
  tsvr->Start();
    return 0; 
 }
 






makefile

	httserver:Main.cc
	g++ -o $@ $^ -std=c++11 -lpthread
.PHONY:clean
clean:
	rm -f httserver

Sock.hpp(TCP套接字)



#include<iostream>
#include<cstring>
#include<cstdlib>
#include<netinet/in.h>
#include<arpa/inet.h>
#include<sys/socket.h>
#include<unistd.h>
#include"Log.hpp"
#include"Err.hpp"

static const int  gbacklog=32;
static const int defaultfd=-1;
class Sock
{
 public:
 Sock() //构造
 :_sock(defaultfd)
 {
 }

 void  Socket()//创建套接字
 {
  _sock=socket(AF_INET,SOCK_STREAM,0);
  if(_sock<0)//套接字创建失败
  {
    logMessage( Tatal,"socket error,code:%s,errstring:%s",errno,strerror(errno));
    exit(SOCKET_ERR);
  }
 }

  void Bind(uint16_t port)//绑定
  {
   struct sockaddr_in local;
   memset(&local,0,sizeof(local));//清空
   local.sin_family=AF_INET;//16位地址类型
   local.sin_port= htons(port); //端口号
   local.sin_addr.s_addr= INADDR_ANY;//IP地址
   
   //若小于0,则绑定失败
   if(bind(_sock,(struct sockaddr*)&local,sizeof(local))<0)
   {
      logMessage( Tatal,"bind error,code:%s,errstring:%s",errno,strerror(errno));
      exit(BIND_ERR);
   }
  }
   
   void Listen()//将套接字设置为监听状态
   {
      //小于0则监听失败
      if(listen(_sock,gbacklog)<0)
      {
        logMessage( Tatal,"listen error,code:%s,errstring:%s",errno,strerror(errno));
        exit(LISTEN_ERR);
      }
   }

   int Accept(std::string *clientip,uint16_t * clientport)//获取连接
   {
        struct sockaddr_in temp;
        socklen_t len=sizeof(temp);
        int sock=accept(_sock,(struct sockaddr*)&temp,&len);

        if(sock<0)
        {
             logMessage(Warning,"accept error,code:%s,errstring:%s",errno,strerror(errno));
        }
        else 
        {
            //inet_ntoa 4字节风格IP转化为字符串风格IP
            *clientip = inet_ntoa(temp.sin_addr) ; //客户端IP地址
            //ntohs 网络序列转主机序列
            *clientport= ntohs(temp.sin_port);//客户端的端口号
            

        }
        return sock;//返回新获取的套接字
   }

   int Connect(const std::string&serverip,const uint16_t &serverport )//发起链接
   {
      struct sockaddr_in server;
      memset(&server,0,sizeof(server));//清空
      server.sin_family=AF_INET;//16位地址类型
      server.sin_port=htons(serverport);//端口号
      //inet_addr  字符串风格IP转化为4字节风格IP
      server.sin_addr.s_addr=inet_addr(serverip.c_str());//IP地址
      //成功返回0,失败返回-1
      return  connect(_sock, (struct sockaddr*)&server,sizeof(server));
    
    }

    int Fd()
    {
      return _sock;
    }
    void Close()
    {
      if(_sock!=defaultfd)
     {
       close(_sock);
     }

    }
    
 ~Sock()//析构
 {
    
 }
 private:
 int _sock;

};

Until.hpp

#pragma once
#include<iostream>
#include<string>
#include<sys/types.h>
#include<sys/stat.h>
#include<unistd.h>
#include<fcntl.h>
#include<sstream>
#include"Log.hpp"

class Util
{
 
public:


 static bool  ReadFile(const std::string &path,std::string *fileContent  )//读取整个文件内容
 {
    //1.获取文件本身的大小
     struct stat st;//定义一个struct stat 类型的结构体
     int n=stat(path.c_str(),&st);
     if(n<0)//读取失败
     {
        return false;
     }
      int size = st.st_size;


     //2.调整string的空间
     fileContent->resize(size); 

     //3.读取
     int fd=open(path.c_str(),O_RDONLY);
     if(fd<0)//读取失败
     {
         return false;
     }
     read(fd,(char*)fileContent->c_str(),size);//从文件fd中读取,放到fileContent
      close(fd);
      logMessage( Info,"read file %s done ",path.c_str());
      return true;
 }

//在message中根据分隔符取出状态行
 static std::string ReadOneLine( std:: string &message,const std::string &sep)
 {
     auto pos=message.find(sep);//查找sep分隔符,找到则返回pos位置的下标
     while(pos==std::string::npos)//没找到
     {
        return "";
     }
     std::string s=message.substr(0,pos);//取[0,pos]区间作为子串
     message.erase(0,pos+sep.size());从下标为0处开始 删除pos+sep.size()个字符
     return s;
 }

   //将请求行分=解析为 请求方法 URL 协议版本
   static bool ParseRequestLine(const std::string &line,std::string * method,std::string *url,std::string *httpVersion)
   {
      //以空格为单位,对内容做提取
         std::stringstream ss(line);

         ss >> *method >> *url >> *httpVersion;
         return true;
   }
 
};




Logo

一起探索未来云端世界的核心,云原生技术专区带您领略创新、高效和可扩展的云计算解决方案,引领您在数字化时代的成功之路。

更多推荐